php使用strlen()判斷中文漢字字符串長度

本文轉載自查看原文 2018-09-26 11:30 14259 php

用 strlen()函數可以簡單模糊的判斷字符長度了，像如果你是漢字與拼音或編碼不一樣使用用strlen()函數計算出來的都不一樣，下面我來給大家介紹一下用strlen()函數的使用方法吧。

們經常會用到了解字符串長度的時候，在PHP里，可以使用strlen()函數來實現。使用方法如下：

PHP strlen() 函數定義和用法

strlen() 函數返回字符串的長度。

語法

strlen(string)

參數：string
描述：必需。規定要檢查的字符串。

實例

代碼如下	復制代碼
<?php echo strlen("Hello world!"); ?>

輸出：12

那么對於中文怎么處理

PHP自帶的函數如strlen()、mb_strlen()都是通過計算字符串所占字節數來統計字符串長度的，一個英文字符占1字節。例：

代碼如下	復制代碼
enStr = ‘Hello,China!’; echo strlen($enStr); // 輸出：12

而中文則不然，做中文網站一般會選擇兩種編碼：gbk/gb2312或是utf-8。utf-8能兼容更多的字符，所以受到很多站長的喜愛。gbk與utf-8對中文的編碼不同，導致中文在gbk與utf-8編碼下所占字節也有差異。

gbk編碼下每個中文字符所占字節為2，例：

代碼如下	復制代碼
$zhStr = ‘您好，中國！’; echo strlen($zhStr); // 輸出：12

utf-8編碼下每個中文字符所占字節為3，例：

代碼如下	復制代碼
$zhStr = ‘您好，中國！’; echo strlen($zhStr); // 輸出：18

那么如何計算這組中文字符串的長度呢？有人可能會說gbk下獲取中文字符串長度除以2，utf-8編碼下除以3不就行了嗎？但是您要考慮字符串並不老實，99%的情況會以中英混合的情況出現。

這是WordPress中的一段代碼，主要思想就是先用正則將字符串分解為個體單元，然后再計算單元的個數即字符串的長度，代碼如下（只能處理utf-8編碼下的字符串）：

代碼如下

復制代碼

$zhStr = ‘您好，中國！’;
$str = ‘Hello,中國！’;

// 計算中文字符串長度
function utf8_strlen($string = null) {
// 將字符串分解為單元
preg_match_all(“/./us”, $string, $match);
// 返回單元個數
return count($match[0]);
}

echo utf8_strlen($zhStr); // 輸出：6
echo utf8_strlen($str); // 輸出：9

下面是補充：准確計算字符個數和計算字節數的區別

代碼如下

復制代碼

/假設當前頁面編碼為GBK
<?php
$str="中國abc";
echo strlen($str); //返回7,因為 GBK編碼每個中文兩個字節，strlen是返回字符串所占的字節長度。
echo "<hr>";
echo iconv_strlen($str,"GBK"); //返回5.iconv_strlen 是統計字符串的字符數量
?>
或者這么寫
<?php
$biaoti="中華人民共和國";
$zijie=strlen($biaoti);
echo $zijie."<br>"; //<br> 換行
?>
//假設當前頁面編碼為UTF-8
<?php
$str="中國abc";
echo strlen($str); //返回9,因為 UTF-8編碼每個中文三個字節，strlen是返回字符串所占的字節長度。
echo "<hr>";
echo iconv_strlen($str,"UTF-8"); //返回5.iconv_strlen 是統計字符串的字符數量
?>
iconv_strlen 是無論是何種編碼，均能計算准確字符個數。
//假設當前頁面編碼為GBK
<?php
$str="中國abc";
echo strlen($str); //返回7,因為 GBK編碼每個中文兩個字節，strlen是返回字符串所占的字節長度。
echo "<hr>";
echo iconv_strlen($str,"GBK"); //返回5.iconv_strlen 是統計字符串的字符數量
?>
//假設當前頁面編碼為UTF-8
<?php
$str="中國abc";
echo strlen($str); //返回9,因為 UTF-8編碼每個中文三個字節，strlen是返回字符串所占的字節長度。
echo "<hr>";
echo iconv_strlen($str,"UTF-8"); //返回5.iconv_strlen 是統計字符串的字符數量
?>

iconv_strlen 是無論是何種編碼，均能計算准確字符個數。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 php漢字字符串長度和截取 PHP文本處理之中文漢字字符串轉換為數組字符串的sizeof長度及strlen長度 php中常用的字符串長度函數strlen()與mb_strlen()實例解釋 php獲取中英文字符串字符長度mb_strlen，字節長度strlen JS判斷字符串長度（英文占1個字符，中文漢字占2個字符）獲取中文漢字字符串相應的拼音和首字母的大小寫 C語言strlen()函數：返回字符串的長度 php 判斷字符串的長度的兩種方法 springMVC返回漢字字符串亂碼，以及返回的字符串亂碼的問題