一篇文章徹底搞懂base64編碼原理


開始

在互聯網中的每一刻,你可能都在享受着Base64帶來的便捷,但對於Base64的基礎原理又了解多少?今天這篇文章帶領大家了解一下Base64的底層實現。

base64是什么東東呢?

Base64編碼是網絡上常見的用於傳輸8bit字節數據的一種編碼方式之一,所以可以依據概括:它是一種編碼方式,記住它不是加密的方式,它沒有秘鑰的概念,任何人拿到數據都能解析出來。它只是一種編碼方式!!

到底哪些地方會使用?

我們在參數傳輸的過程中肯定遇到過這樣一種情況:使用全英文的沒問題,但一旦涉及到中文就會出現亂碼情況。與此類似,網絡上傳輸的字符並不全是可打印的字符,比如二進制文件、圖片等。Base64的出現就是為了解決此問題,它是基於64個可打印的字符來表示二進制的數據的一種方法。

電子郵件剛問世的時候,只能傳輸英文,但后來隨着用戶的增加,中文、日文等文字的用戶也有需求,但這些字符並不能被服務器或網關有效處理,因此Base64就登場了。隨之,Base64在URL、Cookie、網頁傳輸少量二進制文件中也有相應的使用。

實現原理

它的來龍去脈我們是知道了,但它的原理我們還不知道,那下面我們就來徹底搞懂它。

Base64編碼將一個8位子節序列拆散為6位的片段,而且這每個6位的片段都會被分配一個字符,那這個是個什么字符呢?其實它是base64字母表中的64個字符之一,所以顧名思義base64了。而這64個字符可是有講究的,是選擇了最常用而且兼容性最好的64個字符。所以可以算出base64編碼后的字符串大約比編碼前大了33%,因為用8位來表示6位。下面的詳細的例子,大家來感受下。

Base64還有幾個規則如下:

①.3字符變為4字符。

②每76個字符增加一個換行符。

③.結束符也要編碼。

例子

加入編碼前的數據是“Ow!”,那編碼之后是4個字符的base64編碼值“T3ch”。下面是具體的轉換過程。

  • 1, 字符串"Ow!"被拆分成3個8位的字節(0x4F、0x77、0x21)。看下圖:
一篇文章徹底搞懂base64編碼原理

 

  • 2, 這3字節構成了一個24位的二進制 01001111 ,01110111 ,00100001。看下圖:
一篇文章徹底搞懂base64編碼原理

 

  • 3, 這些為被划分為一些6位的序列010011、110111、011100、1000001。看下圖:
一篇文章徹底搞懂base64編碼原理

 

  • 4, 每6位值都表示了從0~63數值,在base64字母表中的都有對應的字符。所以查表轉換得出是4字符的字符串“T3ch”。如下圖所示轉換表。
一篇文章徹底搞懂base64編碼原理

 

整個過程就over了,就是這么簡單,大家理解了嗎?

總結

大多數編碼都是由字符串轉化成二進制的過程,而Base64的編碼則是從二進制轉換為字符串。與常規恰恰相反,

Base64編碼主要用在傳輸、存儲、表示二進制領域,不能算得上加密,只是無法直接看到明文。也可以通過打亂Base64編碼來進行加密。

中文有多種編碼(比如:utf-8、gb2312、gbk等),不同編碼對應Base64編碼結果都不一樣。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM