欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python二進(jìn)制串轉(zhuǎn)換為通用字符串的方法

 更新時間:2018年07月23日 16:45:45   作者:張土豆  
今天小編就為大家分享一篇Python二進(jìn)制串轉(zhuǎn)換為通用字符串的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

一個小問題

今天在做一個實(shí)驗(yàn)時,需要對一個包含中英文詞匯的TXT文件進(jìn)行讀入和整理。

Python代碼的編碼規(guī)則為UTF-8。在讀入時,文件的每行是二進(jìn)制串,形如:

b'heroes\xff.....

在對每行進(jìn)一步進(jìn)行處理時,要求處理對象必須為通用字符串,所以:

lineVec = str(line).strip().split('\t')

此時的lineVec的元素類型為string,但輸出是仍然是 “b'heros\xff…..” ,仍然無法擺脫二進(jìn)制標(biāo)志的影響。然而,尷尬的是,在后邊對以lineVec元素作為鍵的字典進(jìn)行索引時,只能獲得通用字符串的鍵。所以,每次索引都以KeyError退出。

在多次嘗試之后,我發(fā)現(xiàn):二進(jìn)制串在經(jīng)過str()函數(shù)轉(zhuǎn)化之后,已經(jīng)將所有的內(nèi)容都轉(zhuǎn)化成了一個通用的字符串。也就是說,“b'heros\xff……”中的所有字符都是可以用python的字符串處理手段處理的。

給定一個 word=”b'heros”,如果希望得到通用字符串形式的單詞”heros”,那么我們可以直接取字符串word的第3至最后一個字母,或?qū)ⅰ癰'”直接替換掉:

newWord = word[2:-1]
#或
newWord = word.replace("b'",'') #因?yàn)閱我柺莗ython中表示字符串的特殊功能字符,所以被替換的字 

符寫作'b''會報錯。需要用雙引號把單引號括起來。

在用上面的方法把字典鍵都更新了一遍之后,世界瞬間和諧了。

一些擴(kuò)充

在解決上邊的問題的過程中,搜索了許多相關(guān)的解決方法,對python中二進(jìn)制串與通用字符串之間的轉(zhuǎn)換有了一定的了解。但都是關(guān)于純英語字符串轉(zhuǎn)換的,對上邊的中文字符無用。用下面方法轉(zhuǎn)換中文字符串時會出現(xiàn)編碼錯誤。

給定通用字符串 string = ‘a(chǎn) string' , 需要把它轉(zhuǎn)換為二進(jìn)制串時,可以直接調(diào)用字符串的內(nèi)置方法:

print string
>>>a string

bstring = string.encode('ascii') # encode方法,參數(shù)用來指定編碼標(biāo)準(zhǔn)
print bstring
>>>b'a string'

string1 = bstring.decode('ascii') # encode的逆,對二進(jìn)制串進(jìn)行解碼
print string1
>>>a string

在進(jìn)行文本文件讀入和解析時,經(jīng)常會遇到這樣的二進(jìn)制問題,希望對大家有所幫助。

以上這篇Python二進(jìn)制串轉(zhuǎn)換為通用字符串的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

最新評論