事件背景:
之前做h5小游戲,需要后端輸出用戶的相關信息給前端,輸出的內容有:用戶id,用戶昵稱等字段,使用get方式傳參。后端使用PHP語言對中文昵稱進行格式化編碼,使用的是常用的urlencode函數。
出現問題:
使用urlencode這個函數進行格式化,urlencode函數會把空格編碼為為:+
當然,前端在接收時可以解碼后進行替換 + 為空格的方式處理。但是這樣就多做了一步,很麻煩,有的時候我們的數據接口是開發給第三方或者其他使用的,他們在處理中不一定完全按照這樣的思路來做。
比如前端是用Python接收,直接解碼后顯示,昵稱就會有 + 號了。
解決方案:
使用rawurlencode
在PHP中,urlencode把空格編碼為+號,rawurlencode把空格編碼為%20
PHP Manual對兩個函數的說明:
urlencode: 返回字符串,返回字符串,此字符串中除了 -_. 之外的所有非字母數字字符都將被替換成百分號(%)后跟兩位十六進制數,空格則編碼為加號(+)。此編碼與 WWW 表單 POST 數據的編碼方式是一樣的,同時與 application/x-www-form-urlencoded 的媒體類型編碼方式一樣。由於歷史原因,此編碼在將空格編碼為加號(+)方面與 RFC1738 編碼(參見 rawurlencode())不同。
rawurlencode:返回字符串,此字符串中除了 -_. 之外的所有非字母數字字符都將被替換成百分號(%)后跟兩位十六進制數。這是在 RFC 1738 中描述的編碼,是為了保護原義字符以免其被解釋為特殊的 URL 定界符,同時保護 URL 格式以免其被傳輸媒體(像一些郵件系統)使用字符轉換時弄亂。
所以,在使用PHP傳中文編碼時,用rawurlencode
------------------------------------------------------------------------------
