Base64算法


簡單概念理解:

      Base64算法使用了單表置換算法的思想。Base64使用一個由64個字符組成的映射表,見 Base64字符映射表, 然后其他的所有符號都根據這個映射表轉換成對應的字符。
      注意:Base64是在給定字符編碼(如:gbk,utf-8)的基礎上進行的,因為經過這些字符編碼的編碼之后,已經轉換成該編碼的二進制字節碼了
                 這樣Base64才能使用它的64字符進行轉換
 
 
Base64的實現原理:
      1)將給定的字符串轉換成對應的字符編碼(如:GBK、UTF-8)
      2)將獲得該字符編碼轉換成二進制碼
      3)對獲得的二進制碼進行分組操作
               第一步:每3個字節(8位二進制)為一組,一共24個二進制位
               第二步:將這個24個二進制位分成4組,每個組有6個二進制位,不足6位的,后面補0。
               第三步:在每個組前面加兩個0,這樣每個組就又變成了8位,即每個組一個字節,4個組就4個字節了。
               第四步:根據Base64的轉碼表找到每個字節對應的符號,這個符號就是Base64的編碼值
 
 
 
Base64編碼表
       
 
           Value指二進制對應的十進制編碼,Encoding指Base64的編碼值
 
 
 
Base64編碼規則:
        經過Base64編碼后的字符串的字符數一定是4的整數倍。在使用Base64編碼時,如果得到的字符數不為4的整數倍,則后面使用等號 ‘=’補足
 
 
 
舉例說明:
        舉一個具體的實例,演示英語單詞Man如何轉成Base64編碼。
Text content M a n
ASCII 77 97 110
Bit pattern 0 1 0 0 1 1 0 1 0 1 1 0 0 0 0 1 0 1 1 0 1 1 1 0
Index 19 22 5 46
Base64-Encoded T W F u

第一步,"M"、"a"、"n"的ASCII值分別是77、97、110,對應的二進制值是01001101、01100001、01101110,將它們連成一個24位的二進制字符串010011010110000101101110。

第二步,將這個24位的二進制字符串分成4組,每組6個二進制位:010011、010110、000101、101110。

第三步,在每組前面加兩個00,擴展成32個二進制位,即四個字節:00010011、00010110、00000101、00101110。它們的十進制值分別是19、22、5、46。

第四步,根據上表,得到每個值對應Base64編碼,即T、W、F、u。

    因此,Man的Base64編碼就是TWFu。

 

       如果字節數不足三,則這樣處理:

a)二個字節的情況:將這二個字節的一共16個二進制位,按照上面的規則,轉成三組,最后一組除了前面加兩個0以外,后面也要加兩個0。這樣得到一個三位的Base64編碼,再在末尾補上一個"="號。

比如,"Ma"這個字符串是兩個字節,可以轉化成三組00010011、00010110、00010000以后,對應Base64值分別為T、W、E,再補上一個"="號,因此"Ma"的Base64編碼就是TWE=。

b)一個字節的情況:將這一個字節的8個二進制位,按照上面的規則轉成二組,最后一組除了前面加二個0以外,后面再加4個0。這樣得到一個二位的Base64編碼,再在末尾補上兩個"="號。

比如,"M"這個字母是一個字節,可以轉化為二組00010011、00010000,對應的Base64值分別為T、Q,再補上二個"="號,因此"M"的Base64編碼就是TQ==。

 

     再舉一個中文的例子,漢字"嚴"如何轉化成Base64編碼?
     這里需要注意,漢字本身可以有多種編碼,比如gb2312、utf-8、gbk等等,每一種編碼的Base64對應值都不一樣。下面的例子以utf-8為例。
     首先,"嚴"的utf-8編碼為E4B8A5,寫成二進制就是三字節的"11100100 10111000 10100101"。將這個24位的二進制字符串,按照第3節中的規則,轉換成四組         一共32位的二進制值"00111001 00001011 00100010 00100101",相應的十進制數為57、11、34、37,它們對應的Base64值就為5、L、i、l。
     所以,漢字"嚴"(utf-8編碼)的Base64值就是5Lil。

 

Java版Base64編碼和解碼實現:
 
     方案一:使用Apache的 org.apache.commons.codec.binary.Base64類

 

       //Base64編碼
   /*String str = new String(Base64.encodeBase64("中國".getBytes("gbk")) ,"gbk");
     System.out.println(str);*/
        
   //Base64編碼,對輸出結果中,每76個字符追加一個回車換行符
   String str = new String(Base64.encodeBase64("中國".getBytes("gbk") ,true) ,"gbk");
   System.out.println(str);
        
   //Base64解碼
   String str2 = new String(Base64.decodeBase64(str.getBytes("gbk")) ,"GBK");

   System.out.println(str2);

 
  方案二:使用sun內部使用類 sun.misc.BASE64Encoder、 sun.misc.BASE64Decoder  

 

    
   //Base64編碼
   BASE64Encoder encoder = new BASE64Encoder();
   String encodeStr = encoder.encode("中國".getBytes("gbk"));
   System.out.println(encodeStr);
        
   //Base64解碼
   BASE64Decoder decoder = new BASE64Decoder();
   String str = new String(decoder.decodeBuffer(encodeStr) ,"gbk");
   System.out.println(str);  

 


 
 
 
 
 
 
 






免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM