在python3的標准庫中,已經移除了md5,而關於hash加密算法都放在hashlib這個標准庫中,如SHA1、SHA224、SHA256、SHA384、SHA512和MD5算法等。
以下為官方文檔的介紹:
https://docs.python.org/3/library/hashlib.html?highlight=hashlib#credits
md5()方法使用
update(arg)傳入arg對象來更新hash的對象。必須注意的是,該方法只接受byte類型,否則會報錯。這就是要在參數前添加b來轉換類型的原因。
同時要注意,重復調用update(arg)方法,是會將傳入的arg參數進行拼接,而不是覆蓋。也就是說,m.update(a); m.update(b) 等價於m.update(a+b)。
hexdigest()在英語中hex有十六進制的意思,因此該方法是將hash中的數據轉換成數據,其中只包含十六進制的數字。
>>> import hashlib >>> m = hashlib.md5() >>> m.update(b'123') >>> m.hexdigest() '202cb962ac59075b964b07152d234b70' # 或者可以這樣(最常見的寫法,常用於圖片的命名) >>> hashlib.md5(b'123').hexdigest() '202cb962ac59075b964b07152d234b70' # 也可以使用hash.new()這個一般方法,hashlib.new(name[, data]),name傳入的是哈希加密算法的名稱,如md5 >>> hashlib.new('md5', b'123').hexdigest() '202cb962ac59075b964b07152d234b70'
以上是對於英文進行md5加密的,
如果要對中文進行加密,發現按照上面來寫會報錯,原因在於字符轉碼問題,要如下寫:
>>> import hashlib >>> data = '你好' >>> hashlib.md5(data.encode(encoding='UTF-8')).hexdigest() '7eca689f0d3389d9dea66ae112e5cfd7'
此處先將數據轉換成UTF-8格式的,使用網上工具對比下加密的結果,發現有的md5加密工具並不是使用UTF-8格式加密的。
經測試目前發現可以轉為UTF-8、GBK、GB2312、GB18030,不分大小寫(因為GBK/GB2312/GB18030均是針對漢字的編碼,所以md5加密后結果一樣)。
>>> hashlib.md5('你好'.encode(encoding='UTF-8')).hexdigest() '7eca689f0d3389d9dea66ae112e5cfd7' >>> hashlib.md5('你好'.encode(encoding='GBK')).hexdigest() 'b94ae3c6d892b29cf48d9bea819b27b9' >>> hashlib.md5('你好'.encode(encoding='GB2312')).hexdigest() 'b94ae3c6d892b29cf48d9bea819b27b9' >>> hashlib.md5('你好'.encode(encoding='GB18030')).hexdigest() 'b94ae3c6d892b29cf48d9bea819b27b9'