http://www.keakon.net/2010/01/04/SHA-1%20vs%20SHA-256
最近想在GAE上實現一個驗證碼,但又不想用傳統的鍵盤輸入方式。一來是習慣用鼠標,切換到鍵盤很麻煩;二來是生成圖片的成本很大,在GAE上還不能用C實現;三是在讓機器難以識別的同時,也會造成用戶的困惑。
所以想到Google曾經提出的一個技術:提供一組選項,用鼠標將正確的選項拖動到指定位置,然后提交。
在實現時我發現,如果不在客戶端加密的話,這個提交過程是可以直接機器模擬的,也就造成驗證碼沒有意義了。
既然加密是必須的,那么接着就該選擇和非對稱加密了。然而思考了一番后發現,如果用戶本身要偽裝自己,那么非對稱加密是完全沒用的:公鑰和算法都告訴給用戶了,用戶用機器算出一個值就行了…
而非對稱加密的性能不及前者,所以就應該考慮對稱加密了。而且這個算法還需要經過修改,或者參數是用戶所不知道的,才能防止偽造。
不過前端只能用JavaScript來加密(我不會也不喜歡Flash),那么源碼是必然開放的;但沒人會針對我一個個人網站去研究其加密算法,所以仍然是可行的。
於是回到正題,在選擇對稱加密算法時,有很多流行的選擇,例如MD5和SHA。
實際上雖然MD5和SHA-1有碰撞算法,但並不影響密碼明文的安全性,因為攻擊者甚至都不知道碰撞的目標。但是我還是不選擇MD5,原因是一旦碰撞的目標泄露,有很多網站可以破解MD5加密前的明文,這會泄露用戶的資料,而且MD5的前綴碰撞法速度非常快;而目前仍沒有SHA-1的破解網站,且SHA-1的碰撞算法仍需要263個計算復雜度,這個成本仍然是很大的(需要大型計算機較長時間的運算),所以至少目前不必擔心。更重要的是,這種碰撞並不能讓攻擊者偽造任意密文,因此如果規定明文的格式(例如以時間開頭),並驗證其格式的話,就能排除偽造的密文。
接着就去測試了下性能,在本地計算機上用Python計算10萬個隨機數的hash值,MD5、SHA-1和SHA-256分別為0.20、0.21和0.30秒左右;在GAE上則為0.15、0.16和0.20秒左右。由此可見MD5的性能對於SHA-1來說沒有任何優勢。
測試腳本如下:
from hashlib import md5, sha1, sha256 from random import random from time import time SIZE = 1000000 rands = [`random()` for i in xrange(SIZE)] t = time() hash = [md5(rand).hexdigest() for rand in rands] print time() - t t = time() hash = [sha1(rand).hexdigest() for rand in rands] print time() - t t = time() hash = [sha256(rand).hexdigest() for rand in rands] print time() - t
接着就看客戶端加密了,在網上找到了SHA-1和SHA-256的JavaScript實現,在幾種瀏覽器上測試了一下。
IE 6上計算100次分別為0.11s和0.48s;Firefox 3.5上計算1000次分別為0.26s和0.11s;Chrome 4上計算1000次分別為0.26s和0.11s;0.08s和0.16s。
總體上來說,SHA-1是要快於SHA-256的,這似乎與某些人的測試結果不同,而且即便在最慢的IE 6上,計算1次也就1ms,不會影響用戶的感覺。所以SHA-1足夠了。
測試腳本如下:
var SIZE = 1000; var rands = []; for (var i = 0; i < SIZE; ++i) { rands.push(Math.random().toString()); } var hash = []; t = new Date(); for (rand in rands) { hash.push(SHA1(rand)); } document.write(new Date() - t); document.write('<br/>'); hash = []; t = new Date(); for (rand in rands) { hash.push(SHA256(rand)); } document.write(new Date() - t);
當然,回到最初的目的,實際上不用加密也是可行的。
驗證碼主要是基於較多的可能性,讓窮舉法比較費力來達到目的的;那么如果給用戶一個序列,讓用戶排出正確的順序,而窮舉這個全排列的代價則是很高的。
至於排序的內容,當然不能使用數字或字母;一個不錯的例子是弄幾張照片,叫用戶以照片里人物的年齡順序來排列。