PHP截取帶有漢字的字符串,將漢字按兩個字節計算


<?php
header("Content-type:text/html;charset=utf-8");

/**
*截取字符串,漢字占兩個字節,字母占一個字節
*頁面編碼必須為utf-8
*/
function esub($str, $length = 0,$ext = "..."){

    if($length < 1){
        return $str;
    }

    //計算字符串長度
    $strlen = (strlen($str) + mb_strlen($str,"UTF-8")) / 2;
    if($strlen < $length){
        return $str;
    }

    if(mb_check_encoding($str,"UTF-8")){
        $str = mb_strcut(mb_convert_encoding($str, "GBK","UTF-8"), 0, $length, "GBK");
        $str = mb_convert_encoding($str, "UTF-8", "GBK");

    }else{

        return "不支持的文檔編碼";
    }
    
    $str = rtrim($str," ,.。,-——(【、;‘“??《<@");
    return $str.$ext;
}

$str = "L對每個人都說還好";

var_dump(esub($str,9));

 

程序運行結果: string 'L對每個人...' (length=16)

本函數未考慮在gb2312編碼下的支持,因為某些函數在不同編碼文件下的輸出不一樣,原因詳見此鏈接


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM