URLEncode:是對網頁url所包含中文字符的一種編碼轉化方式,URLEncode有兩種常見方式,一種是基於GB2312的 Encode(Baidu、Yisou等搜索引擎使用),另一種是基於UTF-8的Encode(Google、Yahoo等使用)。下面來看兩種方式的 Encode與Decode的區別:
中文 -> GB2312的Encode -> %D6%D0%CE%C4
中文 -> UTF-8的Encode -> %E4%B8%AD%E6%96%87
Html網頁中的URLEncode:
編碼為GB2312的html文件中:http://www.baidu.com/中文.rar -> 瀏覽器自動轉換為 -> http://www.baidu.com/%D6%D0%CE%C4.rar
后來發現Firefox對GB2312的Encode的中文URL支持不好,因為它默認是UTF-8編碼發送URL的,但是ftp://協議可以,這應該算是火狐的一個bug。
下面來看一段PHP中URLEncode編碼轉換的代碼實例:
//GB2312中的Encode示例 echo urlencode("中文-_. ")."\n"; //%D6%D0%CE%C4-_.+ echo urldecode("%D6%D0%CE%C4-_. ")."\n"; //中文-_. echo rawurlencode("中文-_. ")."\n"; //%D6%D0%CE%C4-_.%20 echo rawurldecode("%D6%D0%CE%C4-_. ")."\n"; //中文-_.
除了“-_.”之外的所有非字母數字字符都將被替換成百分號“%”后跟兩位十六進制數。
urlencode和rawurlencode的區別:urlencode將空格編碼為加號“+”,rawurlencode將空格編碼為加號“%20”。
如果要使用UTF-8的Encode,有兩種方法:
第一種是將文件保存為UTF-8文件,直接使用urlencode、rawurlencode即可。
第二種方法是使用mb_convert_encoding函數轉換,示例代碼如下:
$url='http://www.baidu.com/中文.rar'; echo urlencode(mb_convert_encoding($url,'utf-8','gb2312'))."\n"; echo rawurlencode(mb_convert_encoding($url,'utf-8','gb2312'))."\n";
注:encodeURI不對“:”、“/”、“;”、“?”、“@”等特殊字符進行編碼。