Python二進(jìn)制串轉(zhuǎn)換為通用字符串的方法
一個(gè)小問(wèn)題
今天在做一個(gè)實(shí)驗(yàn)時(shí),需要對(duì)一個(gè)包含中英文詞匯的TXT文件進(jìn)行讀入和整理。
Python代碼的編碼規(guī)則為UTF-8。在讀入時(shí),文件的每行是二進(jìn)制串,形如:
b'heroes\xff.....
在對(duì)每行進(jìn)一步進(jìn)行處理時(shí),要求處理對(duì)象必須為通用字符串,所以:
lineVec = str(line).strip().split('\t')
此時(shí)的lineVec的元素類型為string,但輸出是仍然是 “b'heros\xff…..” ,仍然無(wú)法擺脫二進(jìn)制標(biāo)志的影響。然而,尷尬的是,在后邊對(duì)以lineVec元素作為鍵的字典進(jìn)行索引時(shí),只能獲得通用字符串的鍵。所以,每次索引都以KeyError退出。
在多次嘗試之后,我發(fā)現(xiàn):二進(jìn)制串在經(jīng)過(guò)str()函數(shù)轉(zhuǎn)化之后,已經(jīng)將所有的內(nèi)容都轉(zhuǎn)化成了一個(gè)通用的字符串。也就是說(shuō),“b'heros\xff……”中的所有字符都是可以用python的字符串處理手段處理的。
給定一個(gè) word=”b'heros”,如果希望得到通用字符串形式的單詞”heros”,那么我們可以直接取字符串word的第3至最后一個(gè)字母,或?qū)ⅰ癰'”直接替換掉:
newWord = word[2:-1] #或 newWord = word.replace("b'",'') #因?yàn)閱我?hào)是python中表示字符串的特殊功能字符,所以被替換的字
符寫作'b''會(huì)報(bào)錯(cuò)。需要用雙引號(hào)把單引號(hào)括起來(lái)。
在用上面的方法把字典鍵都更新了一遍之后,世界瞬間和諧了。
一些擴(kuò)充
在解決上邊的問(wèn)題的過(guò)程中,搜索了許多相關(guān)的解決方法,對(duì)python中二進(jìn)制串與通用字符串之間的轉(zhuǎn)換有了一定的了解。但都是關(guān)于純英語(yǔ)字符串轉(zhuǎn)換的,對(duì)上邊的中文字符無(wú)用。用下面方法轉(zhuǎn)換中文字符串時(shí)會(huì)出現(xiàn)編碼錯(cuò)誤。
給定通用字符串 string = ‘a(chǎn) string' , 需要把它轉(zhuǎn)換為二進(jìn)制串時(shí),可以直接調(diào)用字符串的內(nèi)置方法:
print string >>>a string bstring = string.encode('ascii') # encode方法,參數(shù)用來(lái)指定編碼標(biāo)準(zhǔn) print bstring >>>b'a string' string1 = bstring.decode('ascii') # encode的逆,對(duì)二進(jìn)制串進(jìn)行解碼 print string1 >>>a string
在進(jìn)行文本文件讀入和解析時(shí),經(jīng)常會(huì)遇到這樣的二進(jìn)制問(wèn)題,希望對(duì)大家有所幫助。
以上這篇Python二進(jìn)制串轉(zhuǎn)換為通用字符串的方法就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
- Python 內(nèi)置函數(shù)進(jìn)制轉(zhuǎn)換的用法(十進(jìn)制轉(zhuǎn)二進(jìn)制、八進(jìn)制、十六進(jìn)制)
- Python 字符串與二進(jìn)制串的相互轉(zhuǎn)換示例
- Python 字節(jié)流,字符串,十六進(jìn)制相互轉(zhuǎn)換實(shí)例(binascii,bytes)
- Python實(shí)現(xiàn)的十進(jìn)制小數(shù)與二進(jìn)制小數(shù)相互轉(zhuǎn)換功能
- Python 16進(jìn)制與中文相互轉(zhuǎn)換的實(shí)現(xiàn)方法
- python中常見進(jìn)制之間的轉(zhuǎn)換方式
- python十進(jìn)制和二進(jìn)制的轉(zhuǎn)換方法(含浮點(diǎn)數(shù))
- python中str、bytes、十六進(jìn)制字符串之間的相互轉(zhuǎn)換方法
相關(guān)文章
Python?Numpy布爾數(shù)組在數(shù)據(jù)分析中的應(yīng)用小結(jié)
本文深入探討了Python的Numpy庫(kù)中的布爾數(shù)組功能,介紹了布爾運(yùn)算、布爾索引的使用方法,并通過(guò)示例展示了如何在數(shù)據(jù)分析中利用布爾數(shù)組進(jìn)行數(shù)據(jù)篩選和處理,感興趣的朋友一起看看吧2024-09-09詳解如何使用Pandas創(chuàng)建有效且可復(fù)制的代碼
Pandas作為一種多功能和強(qiáng)大的工具而屹立不倒,其直觀的數(shù)據(jù)結(jié)構(gòu)和廣泛的功能使其成為無(wú)數(shù)數(shù)據(jù)專業(yè)人士和愛好者的首選,本文將使用Pandas創(chuàng)建有效且可復(fù)制的代碼,感興趣的可以了解下2024-11-11如何利用opencv對(duì)拍攝圖片進(jìn)行文字識(shí)別
在有些工程中有時(shí)候我們需要對(duì)圖片文字識(shí)別,下面這篇文章主要給大家介紹了關(guān)于如何利用opencv對(duì)拍攝圖片進(jìn)行文字識(shí)別的相關(guān)資料,文中通過(guò)代碼示例介紹的非常詳細(xì),需要的朋友可以參考下2024-03-03TensorFlow實(shí)現(xiàn)從txt文件讀取數(shù)據(jù)
今天小編就為大家分享一篇TensorFlow實(shí)現(xiàn)從txt文件讀取數(shù)據(jù),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02Python3讀寫Excel文件(使用xlrd,xlsxwriter,openpyxl3種方式讀寫實(shí)例與優(yōu)劣)
這篇文章主要介紹了Python3讀寫Excel文件,使用xlrd,xlsxwriter,openpyxl3種方式讀寫實(shí)例與優(yōu)劣,需要的朋友可以參考下2020-02-02Python3.6實(shí)現(xiàn)連接mysql或mariadb的方法分析
這篇文章主要介紹了Python3.6實(shí)現(xiàn)連接mysql或mariadb的方法,結(jié)合實(shí)例形式分析了Python3.6針對(duì)mysql或mariadb數(shù)據(jù)庫(kù)操作的相關(guān)模塊安裝、數(shù)據(jù)庫(kù)與表的創(chuàng)建、數(shù)據(jù)庫(kù)連接等操作技巧與注意事項(xiàng),需要的朋友可以參考下2018-05-05TensorFlow入門使用 tf.train.Saver()保存模型
這篇文章主要介紹了TensorFlow入門使用 tf.train.Saver()保存模型,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2018-04-04