欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

使用Python制作一個翻譯器

 更新時間:2025年02月17日 09:33:45   作者:aiweker  
這篇文章主要為大家詳細介紹了如何使用Python實現(xiàn)一個中英翻譯器,輸入中文或者英文,輸出對應(yīng)的英文或者中文,有需要的小伙伴可以參考一下

一、用Python做一個翻譯器

之前有分享過gradio制作web App,我們今天就基于此做一個翻譯器。文末有試用訪問哦,歡迎點擊。

1.產(chǎn)品說明

實現(xiàn)一個中英翻譯器,輸入中文或者英文,輸出對應(yīng)的英文或者中文,目的是給學(xué)習(xí)英文的用戶,提供單詞解釋服務(wù)。使用方式為手機端為主,PC也可以支持。

初步界面設(shè)計如下:

2.gradio前端布局

import numpy as np
import gradio as gr
import os
from fastapi import FastAPI
import requests
import json
import jieba

with gr.Blocks(title="aiweker") as wekerapp:
    gr.Markdown("## 微客翻譯")
    with gr.Row():
        translate_output = gr.Textbox(
                        label="結(jié)果在這里",
                        lines=10
                    )
    with gr.Row():
        translate_txt = gr.Textbox(show_label=False, placeholder="輸入你要的單詞,中文或者英文").style(container=False)

    with gr.Row():
        with gr.Column(scale=1):
            translate_button = gr.Button("提交")

gradio提供的產(chǎn)品說明設(shè)計中的組件,包括文本框(Textbox)和 按鈕(Button)。由于優(yōu)先支持手機端顯式,布局上一行布局為主,一行一個組件。

3.翻譯器實現(xiàn)

如何實現(xiàn)翻譯功能,可以訪問百度翻譯功能,間接實現(xiàn)翻譯功能。通過分析可以通過https://fanyi.baidu.com/sug可以實現(xiàn)翻譯功能。接口返回多個key-value鍵值對

def translate(input_text):
    url = "https://fanyi.baidu.com/sug"
    headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64)"}
    data = {"kw": input_text}
    rsp = requests.post(url=url, headers=headers, data=data)
    data = json.loads(rsp.content.decode())
    return data

???????# {'errno': 0, 'data': [{'k': '清華大學(xué)', 'v': '名. Tsinghua University'}]}

4.gradio功能調(diào)用

為了說明每一個單詞的解釋,我們接入中文分詞jieba進行分詞。

def translate_process(input_text):
    result = []
    if len(input_text)< 3:
        seg_list = [input_text]
    else:
        seg_list = jieba.cut(input_text, cut_all=False)
    for text in seg_list:
        data = translate(text)
        for ds in data.get('data', []):
            result.append("{}: {}".format(ds.get('k'),ds.get('v')))
            break
    return "\n".join(result)

???????translate_button.click(translate_process, inputs=translate_txt, outputs=translate_output)

click將實現(xiàn)按鈕的點擊事件,輸入前端中的text,輸出結(jié)果也是text組件,處理過程為translate_process,每個分詞的解釋。

執(zhí)行python文件就可以部署了。

python -u app.py

5.總結(jié)和下一步

這里分享一個簡單的app應(yīng)用開發(fā),從產(chǎn)品設(shè)計、代碼開發(fā)到部署。當然這只是一個簡單的demo,再做產(chǎn)品時出來實現(xiàn)功能外,還要考慮市場因素,你可以實現(xiàn)一個功能,但是市場已經(jīng)有類似的產(chǎn)品,你的產(chǎn)品有什么獨特性,有沒有解決別人沒有解決的問題。

下一步計劃:

  • 部署上的優(yōu)化,多進程部署
  • 增加輸入圖片翻譯功能,可以通過手機拍攝,返回翻譯結(jié)果

二、用Python做一個翻譯器進階篇

1. 多進程部署

我們知道,python的多線程實現(xiàn)其實不能很好的發(fā)揮多CPU的計算能力,如果有多核CPU的話建議采用多進程部署。對于python程序可以有很多種方式來多進程部署,如multiprocessing,Ray,Mars等。而對于web app部署用的gunicore+uvicore,負載均衡還會加上nginx。

Gunicorn (Green Unicorn)是一個基于Python的WSGI(Web Server Gateway Interface) HTTP服務(wù)器,它是一個開源的工具,在大量的Python Web應(yīng)用中被廣泛使用,例如 Django、Flask等。在Gunicorn中,使用worker來處理客戶端的請求,可以根據(jù)配置啟動多個worker用來處理請求,同時也支持在同一端口上使用多個worker。

Gunicorn可以使用多個進程在多個CPU上同時運行,提高Web應(yīng)用的并發(fā)能力。它具有以下特點:

1.高可靠性:Gunicorn使用多進程方式運行,任何一個進程出現(xiàn)問題都不會影響整個應(yīng)用的運行,進程間異常自動重啟。

2.高性能:Gunicorn使用高效的異步I/O機制,能夠處理高并發(fā)請求。

3.易于部署:Gunicorn可以通過命令行簡單地啟動應(yīng)用程序,也可以與Nginx等Web服務(wù)器配合使用。

4.高安全性:Gunicorn支持SSL/TLS加密傳輸,可對數(shù)據(jù)進行加密保護,保障數(shù)據(jù)的安全性。

與之相比,Uvicorn 是一個基于 ASGI(Asynchronous Server Gateway Interface) 的 Web 服務(wù)器,它也是用 Python 編寫的,主要的特點是支持異步請求和響應(yīng)。Uvicorn 在處理高負載的 Web 應(yīng)用程序時表現(xiàn)出色,因為它能夠利用 Python 異步編程模型來處理大量并發(fā)請求,在響應(yīng)速度和處理效率上都比 Gunicorn 要快。

通常的組合是Gunicorn+uvicore, 或者Gunicorn+greenlet(異步)

針對翻譯這個小app部署,gradio提供了將app嵌入到FastAPI中,而FastAPI可用gunicore+uvicore部署,具體如下:

# 文件名為translate.py
from fastapi import FastAPI
import gradio as gr
app = FastAPI()

with gr.Blocks() as demo:
    pass
app = gr.mount_gradio_app(app, demo, path="/translate")

# gunicorn translate:app -w 4 -k uvicorn.workers.UvicornWorker

上面的例子為啟動4個進程,接受外部請求。

2. 添加圖片識別功能

為了增加翻譯功能的使用場景,增加了一個上傳或者拍照識別的功能,以區(qū)別其他的產(chǎn)品。

實現(xiàn)這個功能需要:

  • 增加一個上傳圖片的前端界面
  • 圖片ocr識別功能

同樣的,上傳圖片的前端界面采用gradio來編寫,如下:

with gr.Blocks(title="aiweker") as wekerapp:
    gr.Markdown("## 微客翻譯")
    with gr.Row():
        translate_output = gr.Textbox(
                        label="結(jié)果在這里",
                        lines=10
                    )
    with gr.Row():
        translate_txt = gr.Textbox(show_label=False, placeholder="輸入你要的單詞,文或者英文").style(container=False)

    with gr.Row():
        with gr.Column(scale=1):
            translate_button = gr.Button("提交")

    with gr.Row():    
        with gr.Accordion("點這里提交圖片翻譯", open=False):
            translate_image_input = gr.Image()
            translate_image = gr.Button("提交圖片") 

    translate_button.click(translate_process, inputs=translate_txt, outputs=translate_output)
    translate_image.click(ocr_process, inputs=translate_image_input, outputs=translate_output)

其中:

translate_image是圖片提交按鈕,click事件的輸入為圖片,輸出為翻譯后的文本(即對應(yīng)ocr_process輸入?yún)?shù)和輸出參數(shù))

而OCR圖片識別,采用開源OCR paddleocr。安裝和使用參見:

https://github.com/PaddlePaddle/PaddleOCR

需要注意的為了提供識別性能,上傳的圖片需要resize到一個比較小的尺寸如320。

到此這篇關(guān)于使用Python制作一個翻譯器的文章就介紹到這了,更多相關(guān)Python翻譯器內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論