欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python實(shí)現(xiàn)中文轉(zhuǎn)換url編碼的方法

 更新時間:2016年06月14日 10:55:55   作者:zeo  
這篇文章主要介紹了python實(shí)現(xiàn)中文轉(zhuǎn)換url編碼的方法,結(jié)合實(shí)例形式分析了Python針對中文的gbk與utf-8編碼轉(zhuǎn)換的相關(guān)技巧,具有一定參考借鑒價值,需要的朋友可以參考下

本文實(shí)例講述了python實(shí)現(xiàn)中文轉(zhuǎn)換url編碼的方法。分享給大家供大家參考,具體如下:

今天要處理百度貼吧的東西。想要做一個關(guān)鍵詞的list,每次需要時,直接添加 到list里面就可以了。但是添加到list里面是中文的情況(比如‘麗江'),url的地址編碼卻是'%E4%B8%BD%E6%B1%9F',因此需 要做一個轉(zhuǎn)換。這里我們就用到了模塊urllib。

>>> import urllib
>>> data = '麗江'
>>> print data
麗江
>>> data
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> urllib.quote(data)
'%E4%B8%BD%E6%B1%9F'

那我們想轉(zhuǎn)回去呢?

>>> urllib.unquote('%E4%B8%BD%E6%B1%9F')
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> print urllib.unquote('%E4%B8%BD%E6%B1%9F')
麗江

細(xì)心的同學(xué)會發(fā)現(xiàn)貼吧url中出現(xiàn)的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其實(shí)是編碼問題。百度的是gbk,其他的一般網(wǎng)站比如google就是utf8的。所以可以用下列語句實(shí)現(xiàn)。

>>> import sys,urllib 
>>> s = '麗江'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
'%C0%F6%BD%AD'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))
'%E4%B8%BD%E6%B1%9F'
>>>

更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python圖片操作技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python Socket編程技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總

希望本文所述對大家Python程序設(shè)計(jì)有所幫助。

相關(guān)文章

最新評論