Quoted-printable 編碼介紹、編碼解碼轉換


求教,“=B9=A4=D7=F7=BC=F2=B1=A8” 這種是什么編碼方式?

Quoted-printable 可譯為“可打印字符引用編碼”、“使用可打印字符的編碼”,我們收郵件,查看信件原始信息,經常會看到這種類型的編碼!

Quoted-printable編碼
最多時候,我們在郵件頭里面能夠看到這樣的編碼!Content-Transfer-Encoding:quoted-printable
 

它是多用途互聯網郵件擴展(MIME) 一種實現方式。其中MIME是一個互聯網標准,它擴展了電子郵件標准,致力於使其能夠支持非ASCII字符、二進制格式附件等多種格式的郵件消息。目前http協議中,很多采用MIME框架!quoted-printable 就是說用一些可打印常用字符,表示一個字節(8位)中所有非打印字符方法!

Quoted-printable編碼方法

任何一個8位的字節值可編碼為3個字符:一個等號”=”后跟隨兩個十六進制數字(0–9或A–F)表示該字節的數值.例如,ASCII碼換頁符(十進制值為12)可以表示為”=0C”, 等號”=”(十進制值為61)必須表示為”=3D”. 除了可打印ASCII字符與換行符以外,所有字符必須表示為這種格式.

所有可打印ASCII字符(十進制值的范圍為33到126)可用ASCII字符編碼來直接表示, 但是等號”=”(十進制值為61)不可以這樣直接表示.ASCII的水平制表符(tab)與空格符, 十進制為9和32, 如果不出現在行尾則可以用其ASCII字符編碼直接表示。如果這兩個字符出現在行尾,必須QP編碼表示為”=09″ (tab)或”=20″ (space).

如果數據中包含有意義的行結束標志,必須轉換為ASCII回車(CR)換行(LF)序列,既不能用原來的ASCII字符也不能用QP編碼的”=”轉義字符序列。 相反,如果字節值13與10有其它的不是行結束的含義,它們必須QP編碼為=0D與=0A.

quoted-printable編碼的數據的每行長度不能超過76個字符. 為滿足此要求又不改變被編碼文本,在QP編碼結果的每行末尾加上軟換行(soft line break). 即在每行末尾加上一個”=”, 但並不會出現在解碼得到的文本中.

例如:If you believe that truth=beauty, then surely mathematics is the most beautiful branch of philosophy. 編碼后結果是

If you believe that truth=3Dbeauty, then surely=20=
mathematics is the most beautiful branch of philosophy.

編碼里面,有幾個特定限定,一些可打印字符不用編碼,當然如果你按照規范編碼后,也一樣可以顯示的!因此自己簡單自己實現該編碼:

function quoted_printable_encode($string) { 
    return preg_replace('/[^\r\n]{73}[^=\r\n]{2}/', "$0=\r\n", str_replace("%","=",
rawurlencode($string)));
}

一個函數就可以,將所有字符串urlencode轉換后,%號替換為”=”號,然后對非\r\n超過73連續字符,后面加一個=\r\n。這個是簡單實現方法! 按照該編碼詳細說明里面,有些空格、換行,還有一些特殊字符可以不用轉換。不過一起轉換了,也不會有影響!

很多時候,我們用些常見字符表示所有8位其它非打印字符,這種通過,Quoted-printable編碼,只是對該字節轉為16進制后,做簡單增加前綴!然后做些特殊字符處理即可! 它的簡單,及編碼高效,也讓該編碼在郵件格式里面,得到了廣泛使用!好了,就到這里,歡迎交流!


原文網址:http://blog.chacuo.net/494.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM