base16，base32，base64 編碼方式的通俗講解

本文轉載自查看原文 2019-07-18 09:55 2773

作者：林冠宏 / 指尖下的幽靈

博客：http://www.cnblogs.com/linguanh/

GitHub ： https://github.com/af913337456/

騰訊雲專欄： https://cloud.tencent.com/developer/user/1148436/activities

蟲洞區塊鏈專欄：https://www.chongdongshequ.com/article/1536563643883.html

掘金：https://juejin.im/user/587f0dfe128fe100570ce2d8

PS: 本文目的，通俗簡短地介紹一次 base 類編碼方式，然后讓你記住。

首先我們知道數據類型 char 一般占2個字節，當然還有二般的情況，比如1個字節，但這里我們以2字節為例，例如: char r = 'a'，那么如果這種規則被修改了呢，既然可以使用2個字節表示一個字符，那么為什么不可以用3字節，5字節表示？當我們其它的字節個數表示一個字符的時候，就會產生其它效果。而，上述的第一點就是類似這個意思。當代表下標的 bit 位的個數變了，下標的取值范圍也跟着變，比如 2 個 bit 位最大的數是 11 = 3，而 3 個 bit 位最大的數是 111 = 7 。

對於第二點來說，就是一個用來供查表的表格，例如9x9乘法表。這個表格是要被查詢的。

編碼流程

當有了上述兩點的條件后，我們將編碼的流程總結為下面幾點：

例如要被編碼的字符串是：ILU

將 ILU 字符串中的每個字符轉為對應於 Ascii 編碼表的值，I = 73, L = 76, U = 85。
將第一步中的 Ascii 值分別轉為對應的二進制格式，要求必須是形成8 個 bit，不足8比特位高位補0。例如：1 的二進制是 1，明顯不夠8位，最終應該顯示為:0000 0001。ILU 的轉化結果如下：

73 = 01001001

76 = 01001100

85 = 01010101
根據base X(這里的 X 代表 16，32，64等編號) 編碼算法中所指定的y 個 bit 位為一個字符在表格中的下標 的規則，對第2步的進行划分。例如 base 16的規則要求，4位作為一個下標對應一個字符，即每4個位為一部分，故划分如下：

第1部分：0100 是 (73 = 01001001，的前4個位)

第2部分：1001 是 (73 = 01001001，的后4個位)

第3部分：0100

第4部分：1100

第5部分：0101

第6部分：0101
將第三步中划分出的每個部分進行10進制轉換，得出對應於10進制數的下標值，如下：

0100 = 4，1001 = 9，4，12，5，5

最后一步，將第4步中得出的下標數去查表，得出對應的字符，連在一起，就是編碼結果

base16 的默認編碼表字符串是：數字0~9和字母A~F，共16個，將每個的下標和值列表格，如下所示：

base16 的編碼表

下標	編碼值	下標	編碼值
0	0	8	8
1	1	9	9
2	2	10	A
3	3	11	B
4	4	12	C
5	5	13	D
6	6	14	E
7	7	15	F

最終 ILU 的 base16 編碼結果是：494C55

自定義表格

代碼中，我們可以指定自己的編碼表，例如下面的一行：

var encoding = base32.NewEncoding("ybndrfg8ejkmcpqxot1uwisza345h769")

ybndrfg8ejkmcpqxot1uwisza345h769 是 32 個字符，對應 base 32 編碼，下標 0 對應的字符是 y

當上面的 ILU 例子用該表格編碼時，那么就不再是: 494C55

總結

在上面的第3步，對於剛好能夠整數划分的 (8 / 4 = 2 整除)，是不會有出現在最終結果后面補充等於號"="符號的情況的，而不能除盡的，將會被補充為 "=" 。下面是 16，32和64的需要bit位個數和編碼表的總字符

名稱	下標數字的位個數	編碼表字符串	位數不足是否會補全 =
base 16	4	數字0~9 和字母 A~F	不會，位數剛好是 4 的倍數
base 32	5	大寫字母A~Z 和數字2~7	會
base 64	6	大寫字母A_{Z，小寫字母a}z，數字0~9以及"+"，"/"	會

名稱	編碼后，數據量變化
base 16	由一個8位表示一個字符變成 4位表示一個字符，數據量變 2 倍
base 32	變為 8/5 倍
base 64	變為 8/6=4/3 倍

補全的限制，拿base32 來說，因為每5位表示一個字符下標值，而原始數據是8位，這就意味着，划分會出現剩下的情況，例如：
8 - 5 = 3，明顯有3個 bit 位剩下，那么至少要多少個位才能滿足步出現剩下的呢？這是一個最小公倍數問題，就是： 5*8 = 40 位。我們可以驗證一下，當兩個字符的時候，是16位，16/5 = 1，以此類推。

最終，得出在 base32 的編碼中，待編碼數據至少要 >= 40 位，其最終的編碼結果才能不出現 = 號。例如要被編碼的字符是3，很明顯，它的結果是：D=======，后面的 = 都是補全的。

同理，base64 的是至少 24 位，24 是 6 和 8 的最小公倍數。

上述，就是所有內容，記住此類編碼方式的主要點：

一個字符所對應表格中的下標的 bit 位是多少個
對應的編碼表格是多少

剩下的，就是照着模式走，划分、對表，得出結果。

廣告時間

我的由清華大學出版社出版的區塊鏈純技術書籍：

《區塊鏈以太坊DApp開發實戰》
現已出版並可網購。

適合區塊鏈初中級工程師閱讀。

完

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Base64，Base32，Base16進制的區別 Base系列編碼淺析【base16 base32 base64 base85 base36 base 58 base91 base 92 base62】 base16,32,64 base編碼和解碼方法 base16 編碼和解碼 Base32 編碼與解碼關於Base64編碼 Base64編碼 JS實現——Base64編碼解碼，帶16進制顯示 C# Base64方式的編碼與解碼 JAVA實現Base64編碼的三種方式