python實(shí)現(xiàn)中文轉(zhuǎn)換url編碼的方法
本文實(shí)例講述了python實(shí)現(xiàn)中文轉(zhuǎn)換url編碼的方法。分享給大家供大家參考,具體如下:
今天要處理百度貼吧的東西。想要做一個關(guān)鍵詞的list,每次需要時,直接添加 到list里面就可以了。但是添加到list里面是中文的情況(比如‘麗江'),url的地址編碼卻是'%E4%B8%BD%E6%B1%9F',因此需 要做一個轉(zhuǎn)換。這里我們就用到了模塊urllib。
>>> import urllib >>> data = '麗江' >>> print data 麗江 >>> data '\xe4\xb8\xbd\xe6\xb1\x9f' >>> urllib.quote(data) '%E4%B8%BD%E6%B1%9F'
那我們想轉(zhuǎn)回去呢?
>>> urllib.unquote('%E4%B8%BD%E6%B1%9F') '\xe4\xb8\xbd\xe6\xb1\x9f' >>> print urllib.unquote('%E4%B8%BD%E6%B1%9F') 麗江
細(xì)心的同學(xué)會發(fā)現(xiàn)貼吧url中出現(xiàn)的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其實(shí)是編碼問題。百度的是gbk,其他的一般網(wǎng)站比如google就是utf8的。所以可以用下列語句實(shí)現(xiàn)。
>>> import sys,urllib >>> s = '麗江' >>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk')) '%C0%F6%BD%AD' >>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8')) '%E4%B8%BD%E6%B1%9F' >>>
更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python圖片操作技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python Socket編程技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對大家Python程序設(shè)計(jì)有所幫助。
相關(guān)文章
零基礎(chǔ)寫python爬蟲之抓取百度貼吧并存儲到本地txt文件改進(jìn)版
前面已經(jīng)發(fā)了一篇關(guān)于百度貼吧抓取的代碼,今天我們來看下代碼的改進(jìn)版,參考了上篇抓取糗事百科的思路,給需要的小伙伴們參考下吧2014-11-11python 利用PyAutoGUI快速構(gòu)建自動化操作腳本
我們經(jīng)常遇到需要進(jìn)行大量重復(fù)操作的時候,比如:網(wǎng)頁上填表,對 web 版本 OA 進(jìn)行操作,自動化測試或者給新系統(tǒng)首次添加數(shù)據(jù)等,今天就利用PyAutoGUI構(gòu)建自動化操作腳本完成這些重復(fù)的需求2021-05-05Python實(shí)現(xiàn)遠(yuǎn)程調(diào)用MetaSploit的方法
這篇文章主要介紹了Python實(shí)現(xiàn)遠(yuǎn)程調(diào)用MetaSploit的方法,是很有借鑒價值的一個技巧,需要的朋友可以參考下2014-08-08使用scrapy實(shí)現(xiàn)爬網(wǎng)站例子和實(shí)現(xiàn)網(wǎng)絡(luò)爬蟲(蜘蛛)的步驟
本文分二個示例,第一個是個簡單的爬網(wǎng)站的小例子,第二個例子實(shí)現(xiàn)目是從一個網(wǎng)站的列表頁抓取文章列表,然后存入數(shù)據(jù)庫中,數(shù)據(jù)庫包括文章標(biāo)題、鏈接、時間,大家參考使用吧2014-01-01Python函數(shù)式編程之面向過程面向?qū)ο蠹昂瘮?shù)式簡析
這一番我們要學(xué)習(xí)點(diǎn)有難度的了,因此將降低閱讀與理解難度,盡量采用大白話為你鋪墊,因?yàn)樯婕暗囊恍└拍钜彩墙梃b的其它編程語言的風(fēng)格,而且實(shí)際落地中存在部分爭議不過多學(xué)一點(diǎn),總是沒有壞處的2021-09-09實(shí)例詳解Python中的numpy.abs和abs函數(shù)
Numpy是python中最有用的工具之一,它可以有效地處理大容量數(shù)據(jù),下面這篇文章主要給大家介紹了關(guān)于Python中numpy.abs和abs函數(shù)的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-08-08