腳本之家服務器常用軟件

快捷導航

python調用有道智云API實現(xiàn)文件批量翻譯

更新時間：2020年10月10日 16:12:29 作者：程序媛Danny

這篇文章主要介紹了python如何調用有道智云API實現(xiàn)文件批量翻譯，幫助大家更好得理解和使用python，感興趣的朋友可以了解下

最近工作過程中，需要對一批文件進行漢譯英的翻譯，對單個文檔手工復制、粘貼的翻譯方式過于繁瑣，考慮到工作的重復性和本人追求提高效率、少動手（懶），想通過調用已有的接口的方法，自己實現(xiàn)一個批量翻譯工具，一勞永逸。在網(wǎng)上找了幾款翻譯API，通過對比翻譯的結果和學習成本，選擇了有道智云的服務，自己開發(fā)了一個批量翻譯的小軟件。詳細記錄一下使用和開發(fā)過程，后面的小伙伴們有相關需求，可以參考。

批量文檔翻譯工具的使用

我這里開發(fā)批量文檔翻譯工具使用python作為開發(fā)工具，功能如下：

1）通過文件夾選擇多個文檔；

2）可以將多個文檔的翻譯結果存到目標文件夾下。

話不多說，看圖↓↓↓↓↓

部分翻譯結果展示（涉及工作內(nèi)容的保密性，這里用荷塘月色作為樣例）：

開發(fā)過程

下面開始詳細介紹調用有道智云API接口的步驟和軟件開發(fā)的過程：

1、個人開發(fā)者賬號注冊

首先，需要注冊個人的開發(fā)者賬號。

在官網(wǎng)點擊注冊，然后填寫個人資料。即可完成注冊，官網(wǎng)地址：http://ai.youdao.com/gw.s#/

2、創(chuàng)建應用和實例

注冊成功并登錄后個人中心頁面如下圖，有道智云提供了自然語言翻譯、文字識別、語音合成、語音測評等服務接口。這些服務接口都是通過以實例的方式運行的，通過應用進行管理的。需要分別創(chuàng)建實例、創(chuàng)建應用，通過應用獲取應用ID和應用密鑰等信息。

我這里用到的是自然語言翻譯服務，首先，需要分別創(chuàng)建一個應用、創(chuàng)建一個自然語音翻譯的實例；其次，需要將實例綁定到應用上。最后，就可以通過應用的應用ID、應用密鑰調用自然語音翻譯api接口了。有道平臺會對不同的實例、應用的使用情況進行記錄、分析、收費。剛剛注冊的體驗者會有免費體驗字數(shù)和50元的體驗金哦（加客服貌似還會有額外的50元的）。

創(chuàng)建實例的步驟：

根據(jù)使用需求，選擇對應服務（“自然語言翻譯”/“文字識別OCR”/“語音合成TTS”/“語音識別ASR”/“智能語音評測”/“多平臺編輯器”）->“創(chuàng)建實例”，按步驟完成實例創(chuàng)建。

創(chuàng)建應用并綁定實例（應用接口分為三種：API、安卓、ios接口）:

點擊“應用管理”->“我的應用”->“創(chuàng)建應用”，填寫應用名稱等相關信息，選擇接入方式，并綁定我們所創(chuàng)建的實例，完成應用創(chuàng)建。我們這里用到的是API方式接入，安卓、ios接口需要根據(jù)提示填寫相應的信息，詳見官網(wǎng)新手指南。

應用創(chuàng)建成功后，可獲取應用ID（appKey）和應用密鑰等信息，這些信息是調用API接口必不可少的參數(shù)。

3、接口調用及代碼實現(xiàn)

1）API接口介紹

下面介紹API接口的調用方法

文本翻譯API HTTPS地址：https://openapi.youdao.com/api

調用規(guī)則：在調用集成文本翻譯API時，需遵循以下規(guī)則。

規(guī)則	描述
傳輸方式	HTTPS
請求方式	GET/POST
字符編碼	統(tǒng)一使用UTF-8 編碼
請求格式	表單
響應格式	JSON

調用傳參：調用API需要向接口發(fā)送以下字段來訪問服務。

字段名	類型	含義	必填	備注
q	text	待翻譯文本	True	必須是UTF-8編碼
from	text	源語言	True	參考下方支持語言 (可設置為auto)
to	text	目標語言	True	參考下方支持語言 (可設置為auto)
appKey	text	應用ID	True	可在應用管理查看
salt	text	UUID	True	UUID
sign	text	簽名	True	sha256(應用ID+input+salt+curtime+應用密鑰)
signType	text	簽名類型	True	v3
curtime	text	當前UTC時間戳(秒)	true	TimeStamp
ext	text	翻譯結果音頻格式，支持mp3	false	mp3
voice	text	翻譯結果發(fā)音選擇	false	0為女聲，1為男聲。默認為女聲
strict	text	是否嚴格按照指定from和to進行翻譯：true/false	false	如果為false，則會自動中譯英，英譯中。默認為false

簽名生成方法如下：
signType=v3；
sign=sha256(應用ID+input+salt+curtime+應用密鑰)；
其中，input的計算方式為：input=q前10個字符 + q長度 + q后10個字符（當q長度大于20）或 input=q字符串（當q長度小于等于20）；

返回結果格式：返回的結果是json格式，具體說明如下：

字段名	類型	含義	備注
errorCode	text	錯誤返回碼	一定存在
query	text	源語言	查詢正確時，一定存在
translation	Array	翻譯結果	查詢正確時，一定存在
basic	text	詞義	基本詞典，查詞時才有
web	Array	詞義	網(wǎng)絡釋義，該結果不一定存在
l	text	源語言和目標語言	一定存在
dict	text	詞典deeplink	查詢語種為支持語言時，存在
webdict	text	webdeeplink	查詢語種為支持語言時，存在
tSpeakUrl	text	翻譯結果發(fā)音地址	翻譯成功一定存在，需要應用綁定語音合成實例才能正常播放否則返回110錯誤碼
speakUrl	text	源語言發(fā)音地址	翻譯成功一定存在，需要應用綁定語音合成實例才能正常播放否則返回110錯誤碼
returnPhrase	Array	單詞校驗后的結果	主要校驗字母大小寫、單詞前含符號、中文簡繁體

當返回的結果errorCode為 0 時說明調用成功，不為0時，則會出現(xiàn)不同含義的錯誤碼。詳細含義可查閱官方開發(fā)文檔。

2）批量文檔翻譯開發(fā)

批量翻譯demo使用python3實現(xiàn)，為了方便測試，我用tkinter做了簡單的界面，用來讀取待翻譯文檔，指定結果存儲路徑，為了最大化簡化開發(fā)過程，降低測試的時間成本，目前只實現(xiàn)了讀取.txt類型文件的方法。

整個demo分為三個文件，mainwindow.py，translate.py和translatetool.py，mainwindow為UI部分的代碼，translate中實現(xiàn)了批量讀取文檔并翻譯保存的邏輯，translatetool為根據(jù)示例代碼改造后的翻譯方法，需調用其他平臺API時，亦可封裝相應方法，增加了項目的擴展性。

mainwindow的元素如下：

root=tk.Tk()
root.title("netease youdao translation test")
frm = tk.Frame(root)
frm.grid(padx='50', pady='50')
btn_get_file = tk.Button(frm, text='選擇待翻譯文件', command=get_files)
btn_get_file.grid(row=0, column=0, ipadx='3', ipady='3', padx='10', pady='20')
text1 = tk.Text(frm, width='40', height='10')
text1.grid(row=0, column=1)
btn_get_result_path=tk.Button(frm,text='選擇翻譯結果路徑',command=set_result_path)
btn_get_result_path.grid(row=1,column=0)
text2=tk.Text(frm,width='40', height='2')
text2.grid(row=1,column=1)
btn_sure=tk.Button(frm,text="翻譯",command=translate_files)
btn_sure.grid(row=2,column=1)

其中translate_files()方法最終調用了translate類的translate_files()方法：

def translate_files():
 if translate.file_paths:
  translate.translate_files()
  tk.messagebox.showinfo("提示","搞定")
 else :
  tk.messagebox.showinfo("提示","無文件")

類translate定義如下：

import os
from translatetool import connect

class Translate():
 def __init__(self,name,file_paths,result_root_path,trans_type):
  self.name=name
  self.file_paths=file_paths							# 待翻譯文件路徑
  self.result_root_path=result_root_path				# 翻譯結果存儲路徑
  self.trans_type=trans_type
  
 # 翻譯過程：讀取文件-掉用有道api-解析返回信息-保存
 def translate_files(self):
  for file_path in self.file_paths:
   file_name=os.path.basename(file_path)
   file_content=open(file_path,encoding='utf-8').read()
   trans_reult=self.translate_use_netease(file_content)
   resul_file=open(self.result_root_path+'/result_'+file_name,'w').write(trans_reult)
 def translate_use_netease(self,file_content):
  result=','.join(connect(file_content,'zh-CH','EN'))	 # 翻譯API返回結果為一個數(shù)組
  return result

調用有道API主要方法為connect()，根據(jù)API的簽名信息等要求組成data并發(fā)送請求，解析返回的json：

# input輸入待翻譯字段，fromlanguage待翻譯的語言,tolanguage翻譯成的目標語言
# 返回翻譯的字段
def connect(inputtext,fromlanguage,tolanguage):
 q=inputtext
 data = {}
 data['from'] = fromlang
 data['to'] = tolang
 data['signType'] = 'v3'
 curtime = str(int(time.time()))
 data['curtime'] = curtime
 salt = str(uuid.uuid1())
 signStr = APP_KEY + truncate(q) + salt + curtime + APP_SECRET
 sign = encrypt(signStr)
 data['appKey'] = APP_KEY
 data['q'] = q
 data['salt'] = salt
 data['sign'] = sign
 print(data)
 response = do_request(data)
 print(response.content)
 j = json.loads(str(response.content, encoding="utf-8"))["translation"]
 return j

完整demo代碼地址：https://github.com/LemonQH/BatchFileTraslationProgram/tree/master

得益于API的學習成本之低，接口調用部分的開發(fā)過程十分順利，僅有一個小插曲，最開始調用API總是返回錯誤碼206（即時間戳錯誤），最后發(fā)現(xiàn)是我的系統(tǒng)時間比標準時間慢了十分鐘 - - #

總結

對于我此次的需要翻譯的文檔需求來說，有道智云贈送的字數(shù)和賬戶額度，已經(jīng)夠用了，但是如果想長期的使用下去，還是要付費的。最后發(fā)現(xiàn)，有道智云在個人主頁中還提供了按小時統(tǒng)計當日實例調用次數(shù)和查詢字符數(shù)和按天統(tǒng)計歷史天數(shù)內(nèi)實例的調用次數(shù)和字符數(shù)，對有需求的小伙伴，還可以記錄查看自己接口的翻譯量、實時調用量等狀態(tài)。

如上是我整個demo的開發(fā)過程。整體來說從注冊到調用有道智云API的過程還是比較順利的，而且每一步都有官方的詳細文檔可以參照。以至于主要開發(fā)時間都分配給了tkinter排版（順便吐槽下tkinter的“好用” :p)。

以上就是python調用有道智云API實現(xiàn)文件批量翻譯的詳細內(nèi)容，更多關于python 文件批量翻譯的資料請關注腳本之家其它相關文章！

您可能感興趣的文章: