php中文url轉碼


 
   
  PHP中對於URL進行編碼,可以使用 urlencode() 或者 rawurlencode(),二者的區別是前者把空格編碼為 '+',而后者把空格編碼為 '%20',不過應該注意的是,在編碼時應該只對部分URL編碼,否則URL中的冒號和反斜杠也會被轉義。下面是詳細解釋:

string urlencode ( string str)

返回字符串,此字符串中除了 -_. 之外的所有非字母數字字符都將被替換成百分號(%)后跟兩位十六進制數,空格則編碼為加號(+)。此編碼與 WWW 表單 POST 數據的編碼方式是一樣的,同時與 application/x-www-form-urlencoded 的媒體類型編碼方式一樣。由於歷史原因,此編碼在將空格編碼為加號(+)方面與 RFC1738 編碼(參見 rawurlencode())不同。此函數便於將字符串編碼並將其用於 URL 的請求部分,同時它還便於將變量傳遞給下一頁:

例子 1. urlencode() 示例

<?php
echo '<a href="mycgi?foo='urlencode($userinput), '">'
;
?>

注意:小心與 HTML 實體相匹配的變量。像 &amp、&copy 和 &pound 都將被瀏覽器解析,並使用實際實體替代所期待的變量名。這是明顯的混亂,W3C 已經告誡人們好幾年了。參考地址:http://www.w3.org/TR/html4/appendix/notes.html#h-B.2.2 PHP 通過 arg_separator .ini 指令,支持將參數分割符變成 W3C 所建議的分號。不幸的是大多數用戶代理並不發送分號分隔符格式的表單數據。較為簡單的解決辦法是使用 &amp; 代替 & 作為分隔符。你不需要為此修改 PHP 的 arg_separator。讓它仍為 &,而僅使用 htmlentities(urlencode($data)) 對你的 URL 進行編碼。

例子 2. urlencode() 與 htmlentities() 示例

<?php
echo '<a href="mycgi?foo='htmlentities(urlencode($userinput)), '">'
;
?>

string urlencode ( string str)

返回字符串,此字符串中除了 -_. 之外的所有非字母數字字符都將被替換成百分號(%)后跟兩位十六進制數。這是在 RFC 1738 中描述的編碼,是為了保護原義字符以免其被解釋為特殊的 URL 定界符,同時保護 URL 格式以免其被傳輸媒體(像一些郵件系統)使用字符轉換時弄亂。例如,如果你想在 FTP 的 URL 中包含密碼:

例子 1. rawurlencode() 示例 1

<?php
echo '<a href="ftp://user:'rawurlencode('foo @+%/'
),
   
'@ftp.my.com/x.txt">'
;
?>

或者,如果你想通過 URL 的 PATH_INFO 構成部分去傳遞信息:

例子 2. rawurlencode() 示例 2

<?php
echo '<a href="http://x.com/department_list_script/'
,
   
rawurlencode('sales and marketing/Miami'), '">'
;
?>

 

 

        在解碼時,可以使用相應的 urldecode() 和 rawurldecode(),相應地,rawurldecode() 不會把加號('+')解碼為空格,而 urldecode() 可以。 下面是詳細示例:

string urldecode ( string str)

解碼給出的已編碼字符串中的任何 %##。返回解碼后的字符串。

例子 1. urldecode() example

<?php
$a 
explode('&'$QUERY_STRING
);
$i 0
;
while (
$i count($a
)) {
   
$b split('='$a[$i
]);
   echo 
'Value for parameter 'htmlspecialchars(urldecode($b[0
])),
   
' is 'htmlspecialchars(urldecode($b[1])), "<br />\n"
;
   
$i
++;
}
?>

 

string rawurldecode ( string str)

返回字符串,此字符串中百分號(%)后跟兩位十六進制數的序列都將被替換成原義字符。

例子 1. rawurldecode() 示例

<?php

echo rawurldecode('foo%20bar%40baz'); 
// foo bar@baz

?>

        但是,有一點需要注意的地方是,urldecode() 和 rawurldecode() 解碼出的字符串是 UTF-8格式的編碼,如果URL中含有中文的話,而頁面設置又不是 UTF-8 的話,則要把解碼出的字符串進行轉換,才能正常顯示!

        還有一個問題,就是所獲得的 URL 不是 %%nn n={0..F} 的格式,而是 %unnnn n={0..F} 的格式,這時候再使用 urldecode() 和 rawurldecode() 是無法正確解碼的,而要用下面這個函數才能正確解碼:

function utf8RawUrlDecode ($source)
{
    $decodedStr = "";
    $pos = 0;
    $len = strlen ($source);
    while ($pos < $len) {
        $charAt = substr ($source, $pos, 1);
        if ($charAt == '%') {
            $pos++;
            $charAt = substr ($source, $pos, 1);
            if ($charAt == 'u') {
                // we got a unicode character
                $pos++;
                $unicodeHexVal = substr ($source, $pos, 4);
                $unicode = hexdec ($unicodeHexVal);
                $entity = "&#". $unicode . ';';
                $decodedStr .= utf8_encode ($entity);
                $pos += 4;
            }
            else {
                // we have an escaped ascii character
                $hexVal = substr ($source, $pos, 2);
                $decodedStr .= chr (hexdec ($hexVal));
                $pos += 2;
            }
        } else {
            $decodedStr .= $charAt;
            $pos++;
        }
    }
    return $decodedStr;
} 
  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM