MD5算法學習整理


  一路學來 記得筆記不少 但是給自己看 當時就記得很隨意 以為后面都懂 但還是太單純了,現在回顧 自己都完全看不下去,所以以后的都放的博客上,讓自己看懂,讓感興趣的看懂,詳細,暴力 不廢話了 

MD5算法詳解   

    0x01定義:網上很多啊 

      MD5算法是單向散列算法的一種。單向散列算法也稱為HASH算法,是一種將任意長度的信息壓縮至某一固定長度(稱之為消息摘要)的函數(該壓縮過程不可逆)

  我們是對一個字符串進行MD5加密,所以我們先從字符串的處理開始。首先我們要知道一個字符的長度是8位(bit),即一個字節的長度。現在我們要做的就是將一個字符串Str1分割成每512位為一個分組,形如N*512+R,最后多出來的不足512位的R部分先填充一個1,再接無數個0,直到補足512位。這里要注意,R為0時也要補位,這時候補512位,最高位1,形如1000…00;如果R超出448,除了要補滿這個分組外,還要再補上一個512位的分組(因為超過448位則不能留64位出來存放字符串的原長)。

  接着,講講將字符串分塊保存部分。一個512位的字符串分組要分成16個32位的子分組,在每個32位中,以字節為單位通過小端規則存入一個32位的變量中,可以考慮用int類型的變量(一個int變量32位),也可以考慮用unsigned int,這樣之后涉及的循環移位就不用考慮符號位了,這里還是以int為例。因為一個字符就是一個字節(8位),所以一個int類型變量能存放4個字符,假設一個字符串abcd,那么存在一個int類型變量中就是dcba。因此這里我們將字符串每4個字符分成一塊,每一個塊都以小端規則存放在一個int類型的變量中。估計有的人 為(N+1)*512位(如果R超出448,則是(N+2)*512),此時最低的64位預留,用來存放之前str1的長度length(長度為字符個數*8 bit)的值,如果這個length值的二進制位數大於64位,則只保留最低的64位。將這個64位的length放入之前填充好的str2的最后64位又要注意了:將length的64位分成2個32位,相當於2個字(1個字32位),再將這個2個字用類似小端規則排列,分別填入預留的64位。之前我就是這點沒有領悟,估計大家也不是很懂.我具體說明一下:假設64位分成AB(A,B分別表示32位的二進制數,A是高位,B是低位),按小端規則排列后就是BA,將形如BA的64位按B(高位)到A(低位)的順序填入str2預留的64位,而對A,B內部顯示的每個字節則不用做處理。假設長度 0x12,則按A,B兩個字來補位可以得:A=0x0000 0000,B=0x0000 0012。

        至此,補位的思想已經講完了,這里再講講我的具體實現。我的思路是用一個長度為16的int類型的數組int M[16]。因為一個int類型數據有32位,16個加起來剛好一共512位,是一個分組的長度。我剛好就按順序M[0]…M[15]表示一個512位的數。我再聲明一個容器vector,用來存放每個M[16],因為分組個數不一定只有一個。
最后我舉個例子方便大家理解。首先介紹一些常識:a – 61, b – 62, c – 63, d – 64, e – 65。這里“a – 61”表示a的ASCII碼十六進制表示是0x61,其他以此類推。
好,假設一個字符串abcde,一共5個字符,長度length 為 5* 8 = 40 = 0x28。512位轉化成十六進制就是64位。原字符串十六進制表示:61 62 63 64 65 00 00…00。完成補位后共512位,只有1個分組,形如: 61 62 63 64 65 80 00… 00(“80”的二進制是1000 0000,即之前的先補一個1,再補很多0的做法)。一個int M[16]的數組就夠存了,即

M[0] = 64 63 62 61,
M[1] = 00 00 80 65,
M[2] = 0,
M[3] = 0
…
M[14] = 00 00 00 28,
M[15] = 0

M[0]~M[15]設好之后,在內存中就是這樣存的61 62 63 64 65 80 00…00(注意這里我們用MD5處理字符串時都考慮內存中的數據的排列順序,得出的MD5也是需要按內存中的數據輸出,所以經常要用小端規則轉換)

    看完這個例子,大家應該對0x01的內容有比較全面的了解了

0x02 MD5有四個32位的被稱作鏈接變量的整數參數,

我們進行如下設置:

A=0x67452301,
B=0xefcdab89,
C=0x98badcfe,
D=0x10325476

數據這樣設置之后,存在內存中就按小端規則排列:01 23 45 67 89 ab cd ef …32 10
就是 0123456789 a到e再反過來儲存的
再聲明四個中間變量a,b,c,d,賦值:a = A, b = B, c = C, d = D。
接着再設置四個非線性函數:

    F(X,Y,Z) =(X&Y)|((~X)&Z)
       G(X,Y,Z) =(X&Z)|(Y&(~Z))
       H(X,Y,Z) =X^Y^Z
       I(X,Y,Z)=Y^(X|(~Z))

(&是與,|是或,~是非,^是異或)
這四個函數的說明:如果X、Y和Z的對應位是獨立和均勻的,那么結果的每一位也應是獨立和均勻的。

 

 

假設M[j]表示消息的第j個子分組(從0到15),<<表示循環左移s,常數ti是4294967296*abs(sin(i))的整數部分,i取值從1到64,單位是弧度。(4294967296等於2的32次方)
 //第一輪計算:j 從0 循環到15,輪數ln=0,i=j%16=j。
FF(a, b, c, d, M[j], s, ti)表示 a = b + ((a + F(b, c, d) + Mj + ti) <<< s)
// 第二輪計算:j 從0 循環到15, 輪數ln=1,i=(1+5*j)%16,使用循環函數G,
GG(a, b, c, d, M[j], s, ti)表示 a = b + ((a + G(b, c, d) + Mj + ti) <<< s)
//第三輪計算:j 從0 循環到15, 輪數ln=2,i=(5+3*j)%16,使用循環函數H
HH(a, b, c, d, M[j], s, ti)表示 a = b + ((a + H(b, c, d) + Mj + ti) <<< s)
//第四輪計算:j 從0 循環到15, 輪數ln=3,i=(7*j)%16,使用循環函數I,其他同第一輪
II(a, b, c, d, M[j], s, ti)表示 a = b + ((a + I(b, c, d) + Mj + ti) <<< s)
要確保形參a在內存中的值改變了,可以在形參中用按引用調用(&a),或返回a值取代原來a值。

0x03 主要循環

這個循環的循環次數為512位分組的個數(即之前提到的N+1或者N+2)。每次循環執行以下的步驟,我就不用文字表述了,直接用代碼展示,相信大家能理解:

{
a = A; b = B; c = C; d = D;
//傳說中的對M[j]的第一輪循環
        FF(a,b,c,d,M[0],7(i),0xd76aa478 (ti));
        FF(d,a,b,c,M[1],12,0xe8c7b756);
        FF(c,d,a,b,M[2],17,0x242070db);
        FF(b,c,d,a,M[3],22,0xc1bdceee);
        FF(a,b,c,d,M[4],7,0xf57c0faf);
        FF(d,a,b,c,M[5],12,0x4787c62a);
        FF(c,d,a,b,M[6],17,0xa8304613);
        FF(b,c,d,a,M[7],22,0xfd469501) ;
        FF(a,b,c,d,M[8],7,0x698098d8) ;
        FF(d,a,b,c,M[9],12,0x8b44f7af) ;
        FF(c,d,a,b,M[10],17,0xffff5bb1) ;
        FF(b,c,d,a,M[11],22,0x895cd7be) ;
        FF(a,b,c,d,M[12],7,0x6b901122) ;
        FF(d,a,b,c,M[13],12,0xfd987193) ;
        FF(c,d,a,b,M[14],17,0xa679438e) ;
        FF(b,c,d,a,M[15],22,0x49b40821);
 
        //傳說中對M[j]的第二輪循環
        GG(a,b,c,d,M[1],5,0xf61e2562);
        GG(d,a,b,c,M[6],9,0xc040b340);
        GG(c,d,a,b,M[11],14,0x265e5a51);
        GG(b,c,d,a,M[0],20,0xe9b6c7aa) ;
        GG(a,b,c,d,M[5],5,0xd62f105d) ;
        GG(d,a,b,c,M[10],9,0x02441453) ;//ti
        GG(c,d,a,b,M[15],14,0xd8a1e681);
        GG(b,c,d,a,M[4],20,0xe7d3fbc8) ;
        GG(a,b,c,d,M[9],5,0x21e1cde6) ;
        GG(d,a,b,c,M[14],9,0xc33707d6) ;
        GG(c,d,a,b,M[3],14,0xf4d50d87) ;
        GG(b,c,d,a,M[8],20,0x455a14ed);
        GG(a,b,c,d,M[13],5,0xa9e3e905);
        GG(d,a,b,c,M[2],9,0xfcefa3f8) ;
        GG(c,d,a,b,M[7],14,0x676f02d9) ;
        GG(b,c,d,a,M[12],20,0x8d2a4c8a);
 
        //傳說中對M[j]的第三輪循環
        HH(a,b,c,d,M[5],4,0xfffa3942);
        HH(d,a,b,c,M[8],11,0x8771f681);
        HH(c,d,a,b,M[11],16,0x6d9d6122);
        HH(b,c,d,a,M[14],23,0xfde5380c) ;
        HH(a,b,c,d,M[1],4,0xa4beea44) ;
        HH(d,a,b,c,M[4],11,0x4bdecfa9) ;
        HH(c,d,a,b,M[7],16,0xf6bb4b60) ;
        HH(b,c,d,a,M[10],23,0xbebfbc70);
        HH(a,b,c,d,M[13],4,0x289b7ec6);
        HH(d,a,b,c,M[0],11,0xeaa127fa);
        HH(c,d,a,b,M[3],16,0xd4ef3085);
        HH(b,c,d,a,M[6],23,0x04881d05);
        HH(a,b,c,d,M[9],4,0xd9d4d039);
        HH(d,a,b,c,M[12],11,0xe6db99e5);
        HH(c,d,a,b,M[15],16,0x1fa27cf8) ;
        HH(b,c,d,a,M[2],23,0xc4ac5665);
   
        //傳說中對M[j]的第四輪循環
        II(a,b,c,d,M[0],6,0xf4292244) ;
        II(d,a,b,c,M[7],10,0x432aff97) ;
        II(c,d,a,b,M[14],15,0xab9423a7);
        II(b,c,d,a,M[5],21,0xfc93a039) ;
        II(a,b,c,d,M[12],6,0x655b59c3) ;
        II(d,a,b,c,M[3],10,0x8f0ccc92) ;
        II(c,d,a,b,M[10],15,0xffeff47d);
        II(b,c,d,a,M[1],21,0x85845dd1) ;
        II(a,b,c,d,M[8],6,0x6fa87e4f) ;
        II(d,a,b,c,M[15],10,0xfe2ce6e0);
        II(c,d,a,b,M[6],15,0xa3014314) ;
        II(b,c,d,a,M[13],21,0x4e0811a1);
        II(a,b,c,d,M[4],6,0xf7537e82) ;
        II(d,a,b,c,M[11],10,0xbd3af235);
        II(c,d,a,b,M[2],15,0x2ad7d2bb);
        II(b,c,d,a,M[9],21,0xeb86d391);
 
        A += a;
        B += b;
        C += c;
        D += d;   //這是剛才強調的 把本輪運算的結果傳遞給下一輪 然后再次運算
所以md5的長度始終是128位
}

 

0x04:處理完所有的512位的分組后,得到一組新的A,B,C,D的值,將這些值按ABCD的順序級聯,然后輸出。這里還要注意,輸出的MD5是按內存中數值的排列順序,所以我們要分別對A,B,C,D的值做一個小端規則的轉換。舉個例子:A有32位,分成4個字節A1A2A3A4。輸出A的時候,要這樣輸出:A4A3 A2A1。這樣就能輸出正確的MD5了。

 

想必能看到這都MD5還是有一定興趣的 奉上源碼供調試研究

https://github.com/Arsense/WindowsCode


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM