PHP Unicode編碼相互轉換

本文轉載自查看原文 2015-08-24 13:24 6822 PHP

<?php
/**
* $str 原始中文字符串
* $encoding 原始字符串的編碼，默認utf-8
* $prefix 編碼后的前綴，默認"&#"
* $postfix 編碼后的后綴，默認";"
*/
function unicode_encode($str, $encoding = 'utf-8', $prefix = '&#', $postfix = ';') {
    //將字符串拆分
    $str = iconv("UTF-8", "gb2312", $str);
    $cind = 0;
    $arr_cont = array();

    for ($i = 0; $i < strlen($str); $i++) {
        if (strlen(substr($str, $cind, 1)) > 0) {
            if (ord(substr($str, $cind, 1)) < 0xA1) { //如果為英文則取1個字節 
                array_push($arr_cont, substr($str, $cind, 1));
                $cind++;
            } else {
                array_push($arr_cont, substr($str, $cind, 2));
                $cind+=2;
            }
        }
    }
    foreach ($arr_cont as &$row) {
        $row = iconv("gb2312", "UTF-8", $row);
    }

    //轉換Unicode碼
    foreach ($arr_cont as $key => $value) {
        $unicodestr.= $prefix . base_convert(bin2hex(iconv('utf-8', 'UCS-4', $value)), 16, 10) .$postfix;
    }

    return $unicodestr;
}

/**
* $str Unicode編碼后的字符串
* $decoding 原始字符串的編碼，默認utf-8
* $prefix 編碼字符串的前綴，默認"&#"
* $postfix 編碼字符串的后綴，默認";"
*/
function unicode_decode($unistr, $encoding = 'utf-8', $prefix = '&#', $postfix = ';') {
    $arruni = explode($prefix, $unistr);
    $unistr = '';
    for ($i = 1, $len = count($arruni); $i < $len; $i++) {
        if (strlen($postfix) > 0) {
            $arruni[$i] = substr($arruni[$i], 0, strlen($arruni[$i]) - strlen($postfix));
        }
        $temp = intval($arruni[$i]);
        $unistr .= ($temp < 256) ? chr(0) . chr($temp) : chr($temp / 256) . chr($temp % 256);
    }
    return iconv('UCS-2', $encoding, $unistr);
}

$str = "PHP二次開發：www.php2.cc";

$unistr = unicode_encode($str);
$unistr2 = unicode_decode($unistr);
echo $unistr . '<br />';
echo $unistr2 . '<br />';

$unistr = unicode_encode($str,'GBK','\\u');
$unistr2 = unicode_decode($unistr,'GBK','\\u');
echo $unistr . '<br />';
echo $unistr2 . '<br />';

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 java中文和unicode編碼相互轉換(轉) 關於JAVA字符編碼：Unicode,ISO-8859-1,GBK,UTF-8編碼及相互轉換關於JAVA字符編碼：Unicode,ISO-8859-1,GBK,UTF-8編碼及相互轉換數據庫亂碼問題 & Python 編碼問題（Unicode 的 encode、decode 相互轉換） python2中將Unicode編碼的中文和str相互轉換用JavaScript實現漢字與Unicode的相互轉換 java中unicode和中文相互轉換 Unicode String 相互轉換 C# php unicode編碼和字符串互轉 Python UNICODE GBK UTF-8 之間相互轉換