基于python爬取有道翻譯過程圖解
1.準(zhǔn)備工作
先來到有道在線翻譯的界面http://fanyi.youdao.com/
F12 審查元素 ->選Network一欄,然后F5刷新 (如果看不到Method一欄,右鍵Name欄,選中Method)
輸入文字自動翻譯后發(fā)現(xiàn)Method一欄有GET還有POST;GET是指從服務(wù)器請求和獲得數(shù)據(jù),POST是向指定服務(wù)器提交被處理的數(shù)據(jù)、
隨便打開一個POST,找到preview可以看到我們輸入的“我愛你一生一世”數(shù)據(jù),可以證明post的提交數(shù)據(jù)的
下面分析一下Headers各個字段的意義;User-agent字段很重要
下面來看一下request模塊中urlopen方法,查看文檔;
發(fā)現(xiàn)urlopen有一個data參數(shù),如果參數(shù)沒賦值(默認(rèn)None)就是GET形式,如果data參數(shù)被賦值了,就以POST形式提交
在這里,data參數(shù)其實是一個字典 ;就是源代碼中From Data的數(shù)據(jù)
下面一篇文章是對urlencode與unquote的詳細(xì)解釋:(urllib庫里可惜沒有urldecode函數(shù))
http://www.dbjr.com.cn/article/183857.htm
為什么要進(jìn)行編碼和解碼呢?------》對于一些中文或者字符,url是不識別的,需要進(jìn)行編碼轉(zhuǎn)換!encode('utf-8')把unicode的形式變成utf-8decode('utf-8')把utf-8形式變成Unicode編碼形式2.下面進(jìn)行敲!
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
- Python爬蟲爬取有道實現(xiàn)翻譯功能
- python 簡單的調(diào)用有道翻譯
- python調(diào)用有道智云API實現(xiàn)文件批量翻譯
- Python 調(diào)用有道翻譯接口實現(xiàn)翻譯
- 如何基于Python制作有道翻譯小工具
- 用python3 urllib破解有道翻譯反爬蟲機(jī)制詳解
- Python 20行簡單實現(xiàn)有道在線翻譯的詳解
- 詳解Python3網(wǎng)絡(luò)爬蟲(二):利用urllib.urlopen向有道翻譯發(fā)送數(shù)據(jù)獲得翻譯結(jié)果
- Python3.6實現(xiàn)帶有簡單界面的有道翻譯小程序
- python 實現(xiàn)有道翻譯功能
相關(guān)文章
python時間序列數(shù)據(jù)轉(zhuǎn)為timestamp格式的方法
這篇文章主要介紹了python時間序列數(shù)據(jù)轉(zhuǎn)為timestamp格式的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08python機(jī)器學(xué)習(xí)包mlxtend的安裝和配置詳解
這篇文章主要介紹了python機(jī)器學(xué)習(xí)包mlxtend的安裝和配置詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08python如何實現(xiàn)lazy segment tree惰性段樹算法
LazySegmentTree(惰性段樹)算法是一種數(shù)據(jù)結(jié)構(gòu),專門用于高效處理區(qū)間查詢和更新操作,它利用延遲更新技術(shù)(LazyPropagation),僅在必要時執(zhí)行實際更新,以提升效率,此結(jié)構(gòu)將數(shù)組表達(dá)為二叉樹,每個節(jié)點(diǎn)表示一個數(shù)組區(qū)間2024-10-10Python3實現(xiàn)將一維數(shù)組按標(biāo)準(zhǔn)長度分隔為二維數(shù)組
今天小編就為大家分享一篇Python3實現(xiàn)將一維數(shù)組按標(biāo)準(zhǔn)長度分隔為二維數(shù)組,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-11-11