欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python中使用hashlib模塊處理算法的教程

 更新時間:2015年04月28日 17:38:39   作者:廖雪峰  
這篇文章主要介紹了Python中使用hashlib模塊處理算法的教程,代碼基于Python2.x版本,需要的朋友可以參考下

Python的hashlib提供了常見的摘要算法,如MD5,SHA1等等。

什么是摘要算法呢?摘要算法又稱哈希算法、散列算法。它通過一個函數(shù),把任意長度的數(shù)據(jù)轉(zhuǎn)換為一個長度固定的數(shù)據(jù)串(通常用16進(jìn)制的字符串表示)。

舉個例子,你寫了一篇文章,內(nèi)容是一個字符串'how to use python hashlib - by Michael',并附上這篇文章的摘要是'2d73d4f15c0db7f5ecb321b6a65e5d6d'。如果有人篡改了你的文章,并發(fā)表為'how to use python hashlib - by Bob',你可以一下子指出Bob篡改了你的文章,因為根據(jù)'how to use python hashlib - by Bob'計算出的摘要不同于原始文章的摘要。

可見,摘要算法就是通過摘要函數(shù)f()對任意長度的數(shù)據(jù)data計算出固定長度的摘要digest,目的是為了發(fā)現(xiàn)原始數(shù)據(jù)是否被人篡改過。

摘要算法之所以能指出數(shù)據(jù)是否被篡改過,就是因為摘要函數(shù)是一個單向函數(shù),計算f(data)很容易,但通過digest反推data卻非常困難。而且,對原始數(shù)據(jù)做一個bit的修改,都會導(dǎo)致計算出的摘要完全不同。

我們以常見的摘要算法MD5為例,計算出一個字符串的MD5值:

import hashlib

md5 = hashlib.md5()
md5.update('how to use md5 in python hashlib?')
print md5.hexdigest()

計算結(jié)果如下:

d26a53750bc40b38b65a520292f69306

如果數(shù)據(jù)量很大,可以分塊多次調(diào)用update(),最后計算的結(jié)果是一樣的:

md5 = hashlib.md5()
md5.update('how to use md5 in ')
md5.update('python hashlib?')
print md5.hexdigest()

試試改動一個字母,看看計算的結(jié)果是否完全不同。

MD5是最常見的摘要算法,速度很快,生成結(jié)果是固定的128 bit字節(jié),通常用一個32位的16進(jìn)制字符串表示。

另一種常見的摘要算法是SHA1,調(diào)用SHA1和調(diào)用MD5完全類似:

import hashlib

sha1 = hashlib.sha1()
sha1.update('how to use sha1 in ')
sha1.update('python hashlib?')
print sha1.hexdigest()

SHA1的結(jié)果是160 bit字節(jié),通常用一個40位的16進(jìn)制字符串表示。

比SHA1更安全的算法是SHA256和SHA512,不過越安全的算法越慢,而且摘要長度更長。

有沒有可能兩個不同的數(shù)據(jù)通過某個摘要算法得到了相同的摘要?完全有可能,因為任何摘要算法都是把無限多的數(shù)據(jù)集合映射到一個有限的集合中。這種情況稱為碰撞,比如Bob試圖根據(jù)你的摘要反推出一篇文章'how to learn hashlib in python - by Bob',并且這篇文章的摘要恰好和你的文章完全一致,這種情況也并非不可能出現(xiàn),但是非常非常困難。
摘要算法應(yīng)用

摘要算法能應(yīng)用到什么地方?舉個常用例子:

任何允許用戶登錄的網(wǎng)站都會存儲用戶登錄的用戶名和口令。如何存儲用戶名和口令呢?方法是存到數(shù)據(jù)庫表中:

name  | password
--------+----------
michael | 123456
bob   | abc999
alice  | alice2008

如果以明文保存用戶口令,如果數(shù)據(jù)庫泄露,所有用戶的口令就落入黑客的手里。此外,網(wǎng)站運(yùn)維人員是可以訪問數(shù)據(jù)庫的,也就是能獲取到所有用戶的口令。

正確的保存口令的方式是不存儲用戶的明文口令,而是存儲用戶口令的摘要,比如MD5:

username | password
---------+---------------------------------
michael | e10adc3949ba59abbe56e057f20f883e
bob   | 878ef96e86145580c38c87f0410ad153
alice  | 99b1c2188db85afee403b1536010c2c9

當(dāng)用戶登錄時,首先計算用戶輸入的明文口令的MD5,然后和數(shù)據(jù)庫存儲的MD5對比,如果一致,說明口令輸入正確,如果不一致,口令肯定錯誤。

練習(xí):根據(jù)用戶輸入的口令,計算出存儲在數(shù)據(jù)庫中的MD5口令:

def calc_md5(password):
  pass

存儲MD5的好處是即使運(yùn)維人員能訪問數(shù)據(jù)庫,也無法獲知用戶的明文口令。

練習(xí):設(shè)計一個驗證用戶登錄的函數(shù),根據(jù)用戶輸入的口令是否正確,返回True或False:

db = {
  'michael': 'e10adc3949ba59abbe56e057f20f883e',
  'bob': '878ef96e86145580c38c87f0410ad153',
  'alice': '99b1c2188db85afee403b1536010c2c9'
}

def login(user, password):
  pass

采用MD5存儲口令是否就一定安全呢?也不一定。假設(shè)你是一個黑客,已經(jīng)拿到了存儲MD5口令的數(shù)據(jù)庫,如何通過MD5反推用戶的明文口令呢?暴力破解費(fèi)事費(fèi)力,真正的黑客不會這么干。

考慮這么個情況,很多用戶喜歡用123456,888888,password這些簡單的口令,于是,黑客可以事先計算出這些常用口令的MD5值,得到一個反推表:

'e10adc3949ba59abbe56e057f20f883e': '123456'
'21218cca77804d2ba1922c33e0151105': '888888'
'5f4dcc3b5aa765d61d8327deb882cf99': 'password'

這樣,無需破解,只需要對比數(shù)據(jù)庫的MD5,黑客就獲得了使用常用口令的用戶賬號。

對于用戶來講,當(dāng)然不要使用過于簡單的口令。但是,我們能否在程序設(shè)計上對簡單口令加強(qiáng)保護(hù)呢?

由于常用口令的MD5值很容易被計算出來,所以,要確保存儲的用戶口令不是那些已經(jīng)被計算出來的常用口令的MD5,這一方法通過對原始口令加一個復(fù)雜字符串來實現(xiàn),俗稱“加鹽”:

def calc_md5(password):
  return get_md5(password + 'the-Salt')

經(jīng)過Salt處理的MD5口令,只要Salt不被黑客知道,即使用戶輸入簡單口令,也很難通過MD5反推明文口令。

但是如果有兩個用戶都使用了相同的簡單口令比如123456,在數(shù)據(jù)庫中,將存儲兩條相同的MD5值,這說明這兩個用戶的口令是一樣的。有沒有辦法讓使用相同口令的用戶存儲不同的MD5呢?

如果假定用戶無法修改登錄名,就可以通過把登錄名作為Salt的一部分來計算MD5,從而實現(xiàn)相同口令的用戶也存儲不同的MD5。

練習(xí):根據(jù)用戶輸入的登錄名和口令模擬用戶注冊,計算更安全的MD5:

db = {}

def register(username, password):
  db[username] = get_md5(password + username + 'the-Salt')

然后,根據(jù)修改后的MD5算法實現(xiàn)用戶登錄的驗證:

def login(username, password):
  pass

小結(jié)

摘要算法在很多地方都有廣泛的應(yīng)用。要注意摘要算法不是加密算法,不能用于加密(因為無法通過摘要反推明文),只能用于防篡改,但是它的單向計算特性決定了可以在不存儲明文口令的情況下驗證用戶口令。

相關(guān)文章

  • Python字符串的創(chuàng)建和駐留機(jī)制詳解

    Python字符串的創(chuàng)建和駐留機(jī)制詳解

    字符串駐留是一種在內(nèi)存中僅保存一份相同且不可變字符串的方法,本文重點(diǎn)給大家介紹Python字符串的創(chuàng)建和駐留機(jī)制,感興趣的朋友跟隨小編一起看看吧
    2022-02-02
  • python裝飾器三種裝飾模式的簡單分析

    python裝飾器三種裝飾模式的簡單分析

    這篇文章主要介紹了python裝飾器的三種裝飾模式,幫助大家更好的理解和學(xué)習(xí)python 裝飾器,感興趣的朋友可以了解下
    2020-09-09
  • 使用scrapy實現(xiàn)爬網(wǎng)站例子和實現(xiàn)網(wǎng)絡(luò)爬蟲(蜘蛛)的步驟

    使用scrapy實現(xiàn)爬網(wǎng)站例子和實現(xiàn)網(wǎng)絡(luò)爬蟲(蜘蛛)的步驟

    本文分二個示例,第一個是個簡單的爬網(wǎng)站的小例子,第二個例子實現(xiàn)目是從一個網(wǎng)站的列表頁抓取文章列表,然后存入數(shù)據(jù)庫中,數(shù)據(jù)庫包括文章標(biāo)題、鏈接、時間,大家參考使用吧
    2014-01-01
  • Python PyWebIO提升團(tuán)隊效率使用介紹

    Python PyWebIO提升團(tuán)隊效率使用介紹

    這篇文章主要為大家介紹了Python PyWebIO提升團(tuán)隊效率使用介紹,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-01-01
  • 如何解決安裝python3.6.1失敗

    如何解決安裝python3.6.1失敗

    在本篇文章里小編給大家整理的是關(guān)于安裝python3.6.1失敗的解決方案,需要的讀者們可以跟著學(xué)習(xí)下。
    2020-07-07
  • 簡單了解python的一些位運(yùn)算技巧

    簡單了解python的一些位運(yùn)算技巧

    這篇文章主要介紹了簡單了解python的一些位運(yùn)算技巧,位運(yùn)算的性能大家想必是清楚的,效率絕對高。相信愛好源碼的同學(xué),在學(xué)習(xí)閱讀源碼的過程中會發(fā)現(xiàn)不少源碼使用了位運(yùn)算,需要的朋友可以參考下
    2019-07-07
  • Python實現(xiàn)簡單的獲取圖片爬蟲功能示例

    Python實現(xiàn)簡單的獲取圖片爬蟲功能示例

    這篇文章主要介紹了Python實現(xiàn)簡單的獲取圖片爬蟲功能,涉及Python使用urllib模塊及正則模塊操作頁面元素獲取圖片的相關(guān)技巧,需要的朋友可以參考下
    2017-07-07
  • Python中read()、readline()和readlines()三者間的區(qū)別和用法

    Python中read()、readline()和readlines()三者間的區(qū)別和用法

    這篇文章主要給大家介紹了關(guān)于Python中讀取文件的read()、readline()和readlines()方法三者間的區(qū)別和用法,需要的朋友可以參考下
    2017-07-07
  • jupyter notebook遠(yuǎn)程訪問不了的問題解決方法

    jupyter notebook遠(yuǎn)程訪問不了的問題解決方法

    這篇文章主要介紹了jupyter notebook遠(yuǎn)程訪問不了的問題解決方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-01-01
  • python3.5繪制隨機(jī)漫步圖

    python3.5繪制隨機(jī)漫步圖

    這篇文章主要為大家詳細(xì)介紹了python3.5繪制隨機(jī)漫步圖,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-08-08

最新評論