使用Python制作一個翻譯器

更新時間：2025年02月17日 09:33:45 作者：aiweker

這篇文章主要為大家詳細介紹了如何使用Python實現(xiàn)一個中英翻譯器,輸入中文或者英文,輸出對應的英文或者中文,有需要的小伙伴可以參考一下

一、用Python做一個翻譯器

之前有分享過gradio制作web App，我們今天就基于此做一個翻譯器。文末有試用訪問哦，歡迎點擊。

1.產(chǎn)品說明

實現(xiàn)一個中英翻譯器，輸入中文或者英文，輸出對應的英文或者中文，目的是給學習英文的用戶，提供單詞解釋服務。使用方式為手機端為主，PC也可以支持。

初步界面設計如下：

2.gradio前端布局

import numpy as np
import gradio as gr
import os
from fastapi import FastAPI
import requests
import json
import jieba

with gr.Blocks(title="aiweker") as wekerapp:
    gr.Markdown("## 微客翻譯")
    with gr.Row():
        translate_output = gr.Textbox(
                        label="結果在這里",
                        lines=10
                    )
    with gr.Row():
        translate_txt = gr.Textbox(show_label=False, placeholder="輸入你要的單詞，中文或者英文").style(container=False)

    with gr.Row():
        with gr.Column(scale=1):
            translate_button = gr.Button("提交")

gradio提供的產(chǎn)品說明設計中的組件，包括文本框（Textbox）和按鈕（Button）。由于優(yōu)先支持手機端顯式，布局上一行布局為主，一行一個組件。

3.翻譯器實現(xiàn)

如何實現(xiàn)翻譯功能，可以訪問百度翻譯功能，間接實現(xiàn)翻譯功能。通過分析可以通過https://fanyi.baidu.com/sug可以實現(xiàn)翻譯功能。接口返回多個key-value鍵值對

def translate(input_text):
    url = "https://fanyi.baidu.com/sug"
    headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64)"}
    data = {"kw": input_text}
    rsp = requests.post(url=url, headers=headers, data=data)
    data = json.loads(rsp.content.decode())
    return data

???????# {'errno': 0, 'data': [{'k': '清華大學', 'v': '名. Tsinghua University'}]}

4.gradio功能調用

為了說明每一個單詞的解釋，我們接入中文分詞jieba進行分詞。

def translate_process(input_text):
    result = []
    if len(input_text)< 3:
        seg_list = [input_text]
    else:
        seg_list = jieba.cut(input_text, cut_all=False)
    for text in seg_list:
        data = translate(text)
        for ds in data.get('data', []):
            result.append("{}: {}".format(ds.get('k'),ds.get('v')))
            break
    return "\n".join(result)

???????translate_button.click(translate_process, inputs=translate_txt, outputs=translate_output)

click將實現(xiàn)按鈕的點擊事件，輸入前端中的text，輸出結果也是text組件，處理過程為translate_process，每個分詞的解釋。

執(zhí)行python文件就可以部署了。

python -u app.py

5.總結和下一步

這里分享一個簡單的app應用開發(fā)，從產(chǎn)品設計、代碼開發(fā)到部署。當然這只是一個簡單的demo，再做產(chǎn)品時出來實現(xiàn)功能外，還要考慮市場因素，你可以實現(xiàn)一個功能，但是市場已經(jīng)有類似的產(chǎn)品，你的產(chǎn)品有什么獨特性，有沒有解決別人沒有解決的問題。

下一步計劃：

部署上的優(yōu)化，多進程部署
增加輸入圖片翻譯功能，可以通過手機拍攝，返回翻譯結果

二、用Python做一個翻譯器進階篇

1. 多進程部署

我們知道，python的多線程實現(xiàn)其實不能很好的發(fā)揮多CPU的計算能力，如果有多核CPU的話建議采用多進程部署。對于python程序可以有很多種方式來多進程部署，如multiprocessing，Ray，Mars等。而對于web app部署用的gunicore+uvicore，負載均衡還會加上nginx。

Gunicorn （Green Unicorn）是一個基于Python的WSGI(Web Server Gateway Interface) HTTP服務器，它是一個開源的工具，在大量的Python Web應用中被廣泛使用，例如 Django、Flask等。在Gunicorn中，使用worker來處理客戶端的請求，可以根據(jù)配置啟動多個worker用來處理請求，同時也支持在同一端口上使用多個worker。

Gunicorn可以使用多個進程在多個CPU上同時運行，提高Web應用的并發(fā)能力。它具有以下特點：

1.高可靠性：Gunicorn使用多進程方式運行，任何一個進程出現(xiàn)問題都不會影響整個應用的運行，進程間異常自動重啟。

2.高性能：Gunicorn使用高效的異步I/O機制，能夠處理高并發(fā)請求。

3.易于部署：Gunicorn可以通過命令行簡單地啟動應用程序，也可以與Nginx等Web服務器配合使用。

4.高安全性：Gunicorn支持SSL/TLS加密傳輸，可對數(shù)據(jù)進行加密保護，保障數(shù)據(jù)的安全性。

與之相比，Uvicorn 是一個基于 ASGI(Asynchronous Server Gateway Interface) 的 Web 服務器，它也是用 Python 編寫的，主要的特點是支持異步請求和響應。Uvicorn 在處理高負載的 Web 應用程序時表現(xiàn)出色，因為它能夠利用 Python 異步編程模型來處理大量并發(fā)請求，在響應速度和處理效率上都比 Gunicorn 要快。

通常的組合是Gunicorn+uvicore，或者Gunicorn+greenlet（異步）

針對翻譯這個小app部署，gradio提供了將app嵌入到FastAPI中，而FastAPI可用gunicore+uvicore部署，具體如下：

# 文件名為translate.py
from fastapi import FastAPI
import gradio as gr
app = FastAPI()

with gr.Blocks() as demo:
    pass
app = gr.mount_gradio_app(app, demo, path="/translate")

# gunicorn translate:app -w 4 -k uvicorn.workers.UvicornWorker

上面的例子為啟動4個進程，接受外部請求。

2. 添加圖片識別功能

為了增加翻譯功能的使用場景，增加了一個上傳或者拍照識別的功能，以區(qū)別其他的產(chǎn)品。

實現(xiàn)這個功能需要：

增加一個上傳圖片的前端界面
圖片ocr識別功能

同樣的，上傳圖片的前端界面采用gradio來編寫，如下：

with gr.Blocks(title="aiweker") as wekerapp:
    gr.Markdown("## 微客翻譯")
    with gr.Row():
        translate_output = gr.Textbox(
                        label="結果在這里",
                        lines=10
                    )
    with gr.Row():
        translate_txt = gr.Textbox(show_label=False, placeholder="輸入你要的單詞，文或者英文").style(container=False)

    with gr.Row():
        with gr.Column(scale=1):
            translate_button = gr.Button("提交")

    with gr.Row():    
        with gr.Accordion("點這里提交圖片翻譯", open=False):
            translate_image_input = gr.Image()
            translate_image = gr.Button("提交圖片") 

    translate_button.click(translate_process, inputs=translate_txt, outputs=translate_output)
    translate_image.click(ocr_process, inputs=translate_image_input, outputs=translate_output)

其中：

translate_image是圖片提交按鈕，click事件的輸入為圖片，輸出為翻譯后的文本（即對應ocr_process輸入?yún)?shù)和輸出參數(shù)）

而OCR圖片識別，采用開源OCR paddleocr。安裝和使用參見：

https://github.com/PaddlePaddle/PaddleOCR

需要注意的為了提供識別性能，上傳的圖片需要resize到一個比較小的尺寸如320。

到此這篇關于使用Python制作一個翻譯器的文章就介紹到這了,更多相關Python翻譯器內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: