快捷導(dǎo)航

Python二進制串轉(zhuǎn)換為通用字符串的方法

更新時間：2018年07月23日 16:45:45 作者：張土豆

今天小編就為大家分享一篇Python二進制串轉(zhuǎn)換為通用字符串的方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

一個小問題

今天在做一個實驗時，需要對一個包含中英文詞匯的TXT文件進行讀入和整理。

Python代碼的編碼規(guī)則為UTF-8。在讀入時，文件的每行是二進制串，形如：

b'heroes\xff.....

在對每行進一步進行處理時，要求處理對象必須為通用字符串，所以：

lineVec = str(line).strip().split('\t')

此時的lineVec的元素類型為string,但輸出是仍然是 “b'heros\xff…..” ，仍然無法擺脫二進制標(biāo)志的影響。然而，尷尬的是，在后邊對以lineVec元素作為鍵的字典進行索引時，只能獲得通用字符串的鍵。所以，每次索引都以KeyError退出。

在多次嘗試之后，我發(fā)現(xiàn)：二進制串在經(jīng)過str()函數(shù)轉(zhuǎn)化之后，已經(jīng)將所有的內(nèi)容都轉(zhuǎn)化成了一個通用的字符串。也就是說，“b'heros\xff……”中的所有字符都是可以用python的字符串處理手段處理的。

給定一個 word=”b'heros”，如果希望得到通用字符串形式的單詞”heros”，那么我們可以直接取字符串word的第3至最后一個字母，或?qū)ⅰ癰'”直接替換掉：

newWord = word[2:-1]
#或
newWord = word.replace("b'",'') #因為單引號是python中表示字符串的特殊功能字符，所以被替換的字

符寫作'b''會報錯。需要用雙引號把單引號括起來。

在用上面的方法把字典鍵都更新了一遍之后，世界瞬間和諧了。

一些擴充

在解決上邊的問題的過程中，搜索了許多相關(guān)的解決方法，對python中二進制串與通用字符串之間的轉(zhuǎn)換有了一定的了解。但都是關(guān)于純英語字符串轉(zhuǎn)換的，對上邊的中文字符無用。用下面方法轉(zhuǎn)換中文字符串時會出現(xiàn)編碼錯誤。

給定通用字符串 string = ‘a(chǎn) string' , 需要把它轉(zhuǎn)換為二進制串時，可以直接調(diào)用字符串的內(nèi)置方法：

print string
>>>a string

bstring = string.encode('ascii') # encode方法，參數(shù)用來指定編碼標(biāo)準(zhǔn)
print bstring
>>>b'a string'

string1 = bstring.decode('ascii') # encode的逆，對二進制串進行解碼
print string1
>>>a string

在進行文本文件讀入和解析時，經(jīng)常會遇到這樣的二進制問題，希望對大家有所幫助。

以上這篇Python二進制串轉(zhuǎn)換為通用字符串的方法就是小編分享給大家的全部內(nèi)容了，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

Python?Numpy布爾數(shù)組在數(shù)據(jù)分析中的應(yīng)用小結(jié)
本文深入探討了Python的Numpy庫中的布爾數(shù)組功能,介紹了布爾運算、布爾索引的使用方法,并通過示例展示了如何在數(shù)據(jù)分析中利用布爾數(shù)組進行數(shù)據(jù)篩選和處理,感興趣的朋友一起看看吧
2024-09-09
詳解Python相關(guān)文件常見的后綴名
常見的 Python 文件后綴有：py、pyc 、pyo、 pyi、pyw、 pyd、 pyx 等。本文給大家介紹Python相關(guān)文件常見的后綴名，感興趣的朋友跟隨小編一起看看吧
2021-05-05
詳解如何使用Pandas創(chuàng)建有效且可復(fù)制的代碼
Pandas作為一種多功能和強大的工具而屹立不倒,其直觀的數(shù)據(jù)結(jié)構(gòu)和廣泛的功能使其成為無數(shù)數(shù)據(jù)專業(yè)人士和愛好者的首選,本文將使用Pandas創(chuàng)建有效且可復(fù)制的代碼,感興趣的可以了解下
2024-11-11
python 調(diào)用釘釘機器人的方法
今天小編就為大家分享一篇python 調(diào)用釘釘機器人的方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-02-02
Python 代碼調(diào)試技巧示例代碼
這篇文章主要介紹了Python 代碼調(diào)試技巧,本文通過實例代碼給大家介紹的非常詳細，對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2020-08-08
如何利用opencv對拍攝圖片進行文字識別
在有些工程中有時候我們需要對圖片文字識別,下面這篇文章主要給大家介紹了關(guān)于如何利用opencv對拍攝圖片進行文字識別的相關(guān)資料,文中通過代碼示例介紹的非常詳細,需要的朋友可以參考下
2024-03-03
TensorFlow實現(xiàn)從txt文件讀取數(shù)據(jù)
今天小編就為大家分享一篇TensorFlow實現(xiàn)從txt文件讀取數(shù)據(jù)，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-02-02
Python3讀寫Excel文件(使用xlrd,xlsxwriter,openpyxl3種方式讀寫實例與優(yōu)劣)
這篇文章主要介紹了Python3讀寫Excel文件，使用xlrd,xlsxwriter,openpyxl3種方式讀寫實例與優(yōu)劣,需要的朋友可以參考下
2020-02-02
Python3.6實現(xiàn)連接mysql或mariadb的方法分析
這篇文章主要介紹了Python3.6實現(xiàn)連接mysql或mariadb的方法,結(jié)合實例形式分析了Python3.6針對mysql或mariadb數(shù)據(jù)庫操作的相關(guān)模塊安裝、數(shù)據(jù)庫與表的創(chuàng)建、數(shù)據(jù)庫連接等操作技巧與注意事項,需要的朋友可以參考下
2018-05-05
TensorFlow入門使用 tf.train.Saver()保存模型
這篇文章主要介紹了TensorFlow入門使用 tf.train.Saver()保存模型，小編覺得挺不錯的，現(xiàn)在分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2018-04-04