欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

在Python中使用base64模塊處理字符編碼的教程

 更新時間:2015年04月28日 17:18:49   作者:廖雪峰  
這篇文章主要介紹了在Python中使用base64模塊處理字符編碼的教程,示例代碼基于Python2.x版本,需要的朋友可以參考下

Base64是一種用64個字符來表示任意二進制數(shù)據(jù)的方法。

用記事本打開exe、jpg、pdf這些文件時,我們都會看到一大堆亂碼,因為二進制文件包含很多無法顯示和打印的字符,所以,如果要讓記事本這樣的文本處理軟件能處理二進制數(shù)據(jù),就需要一個二進制到字符串的轉(zhuǎn)換方法。Base64是一種最常見的二進制編碼方法。

Base64的原理很簡單,首先,準備一個包含64個字符的數(shù)組:

['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '/']

然后,對二進制數(shù)據(jù)進行處理,每3個字節(jié)一組,一共是3x8=24bit,劃為4組,每組正好6個bit:

2015428170554476.png (286×141)

這樣我們得到4個數(shù)字作為索引,然后查表,獲得相應(yīng)的4個字符,就是編碼后的字符串。

所以,Base64編碼會把3字節(jié)的二進制數(shù)據(jù)編碼為4字節(jié)的文本數(shù)據(jù),長度增加33%,好處是編碼后的文本數(shù)據(jù)可以在郵件正文、網(wǎng)頁等直接顯示。

如果要編碼的二進制數(shù)據(jù)不是3的倍數(shù),最后會剩下1個或2個字節(jié)怎么辦?Base64用\x00字節(jié)在末尾補足后,再在編碼的末尾加上1個或2個=號,表示補了多少字節(jié),解碼的時候,會自動去掉。

Python內(nèi)置的base64可以直接進行base64的編解碼:

>>> import base64
>>> base64.b64encode('binary\x00string')
'YmluYXJ5AHN0cmluZw=='
>>> base64.b64decode('YmluYXJ5AHN0cmluZw==')
'binary\x00string'

由于標準的Base64編碼后可能出現(xiàn)字符+和/,在URL中就不能直接作為參數(shù),所以又有一種"url safe"的base64編碼,其實就是把字符+和/分別變成-和_:

>>> base64.b64encode('i\xb7\x1d\xfb\xef\xff')
'abcd++//'
>>> base64.urlsafe_b64encode('i\xb7\x1d\xfb\xef\xff')
'abcd--__'
>>> base64.urlsafe_b64decode('abcd--__')
'i\xb7\x1d\xfb\xef\xff'

還可以自己定義64個字符的排列順序,這樣就可以自定義Base64編碼,不過,通常情況下完全沒有必要。

Base64是一種通過查表的編碼方法,不能用于加密,即使使用自定義的編碼表也不行。

Base64適用于小段內(nèi)容的編碼,比如數(shù)字證書簽名、Cookie的內(nèi)容等。

由于=字符也可能出現(xiàn)在Base64編碼中,但=用在URL、Cookie里面會造成歧義,所以,很多Base64編碼后會把=去掉:

# 標準Base64:
'abcd' -> 'YWJjZA=='
# 自動去掉=:
'abcd' -> 'YWJjZA'

去掉=后怎么解碼呢?因為Base64是把3個字節(jié)變?yōu)?個字節(jié),所以,Base64編碼的長度永遠是4的倍數(shù),因此,需要加上=把Base64字符串的長度變?yōu)?的倍數(shù),就可以正常解碼了。

請寫一個能處理去掉=的base64解碼函數(shù):

>>> base64.b64decode('YWJjZA==')
'abcd'
>>> base64.b64decode('YWJjZA')
Traceback (most recent call last):
 ...
TypeError: Incorrect padding
>>> safe_b64decode('YWJjZA')
'abcd'

小結(jié)

Base64是一種任意二進制到文本字符串的編碼方法,常用于在URL、Cookie、網(wǎng)頁中傳輸少量二進制數(shù)據(jù)。

相關(guān)文章

  • python實現(xiàn)尼姆游戲

    python實現(xiàn)尼姆游戲

    這篇文章通過詳細的python代碼實現(xiàn)尼姆游戲,小編覺得挺不錯的?,F(xiàn)在分享給大家,也給大家做個參考,需要的朋友可以收藏下。一起跟隨小編過來看看吧
    2021-12-12
  • Nginx搭建HTTPS服務(wù)器和強制使用HTTPS訪問的方法

    Nginx搭建HTTPS服務(wù)器和強制使用HTTPS訪問的方法

    這篇文章主要介紹了Nginx搭建HTTPS服務(wù)器和強制使用HTTPS訪問的方法,即從HTTP跳轉(zhuǎn)到HTTPS,需要的朋友可以參考下
    2015-08-08
  • keras Lambda自定義層實現(xiàn)數(shù)據(jù)的切片方式,Lambda傳參數(shù)

    keras Lambda自定義層實現(xiàn)數(shù)據(jù)的切片方式,Lambda傳參數(shù)

    這篇文章主要介紹了keras Lambda自定義層實現(xiàn)數(shù)據(jù)的切片方式,Lambda傳參數(shù),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • django寫用戶登錄判定并跳轉(zhuǎn)制定頁面的實例

    django寫用戶登錄判定并跳轉(zhuǎn)制定頁面的實例

    今天小編就為大家分享一篇django寫用戶登錄判定并跳轉(zhuǎn)制定頁面的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-08-08
  • 利用Python寫個摸魚監(jiān)控進程

    利用Python寫個摸魚監(jiān)控進程

    繼打游戲、看視頻等摸魚行為被監(jiān)控后,現(xiàn)在打工人離職的傾向也會被監(jiān)控。今天就帶大家領(lǐng)略一下怎么寫幾行Python代碼,就能監(jiān)控電腦,感興趣的可以學(xué)習(xí)一下
    2022-02-02
  • python語音識別的轉(zhuǎn)換方法

    python語音識別的轉(zhuǎn)換方法

    語音識別技術(shù),也被稱為自動語音識別,目標是以電腦自動將人類的語音內(nèi)容轉(zhuǎn)換為相應(yīng)的文字。應(yīng)用包括語音撥號、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音文檔檢索、簡單的聽寫數(shù)據(jù)錄入等。本文給大家介紹python語音識別的方法,感興趣的朋友一起看看吧
    2021-10-10
  • Python3內(nèi)置函數(shù)chr和ord實現(xiàn)進制轉(zhuǎn)換

    Python3內(nèi)置函數(shù)chr和ord實現(xiàn)進制轉(zhuǎn)換

    這篇文章主要介紹了Python3內(nèi)置函數(shù)chr和ord實現(xiàn)進制轉(zhuǎn)換,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-06-06
  • Python實現(xiàn)某論壇自動簽到功能

    Python實現(xiàn)某論壇自動簽到功能

    這篇文章主要介紹了Python實現(xiàn)論壇自動簽到功能,本文通過實例代碼給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下
    2019-08-08
  • python os.path.isfile()因參數(shù)問題判斷錯誤的解決

    python os.path.isfile()因參數(shù)問題判斷錯誤的解決

    今天小編就為大家分享一篇python os.path.isfile()因參數(shù)問題判斷錯誤的解決,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-11-11
  • python,Django實現(xiàn)的淘寶客登錄功能示例

    python,Django實現(xiàn)的淘寶客登錄功能示例

    這篇文章主要介紹了python,Django實現(xiàn)的淘寶客登錄功能,結(jié)合實例形式分析了Django框架基于淘寶接口的登錄功能相關(guān)操作技巧,需要的朋友可以參考下
    2019-06-06

最新評論