php和JS正則表達式匹配中文

本文轉載自查看原文 2016-06-22 13:46 1531

一、判斷中文和編碼有關 gbk是雙字節，utf8是三字節，可以根據中文的范圍來判斷

編碼范圍

1. GBK (GB2312/GB18030)

\x00-\xff GBK雙字節編碼范圍
\x20-\x7f ASCII
\xa1-\xff 中文
\x80-\xff 中文

2. UTF-8 (Unicode)

\u4e00-\u9fa5 (中文)
\x3130-\x318F (韓文
\xAC00-\xD7A3 (韓文)
\u0800-\u4e00 (日文)
ps: 韓文是大於[\u9fa5]的字符

二、JS判斷中文

var str = "php編程";
if (/^[\u4e00-\u9fa5]+$/.test(str)) {
alert("該字符串全部是中文");
} else {
alert("該字符串不全部是中文");
}

三、PHP中判斷中文

$str = "php編程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("該字符串全部是中文");
} else {
print("該字符串不全部是中文");
}

注意：

在php中，是用\x表示十六進制數據

u (PCRE_UTF8)
此修正符啟用了一個 PCRE 中與 Perl 不兼容的額外功能。模式字符串被當成 UTF-8。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 php用正則表達式匹配中文實例詳解 php用正則表達式匹配中文實例詳解正則表達式中文匹配中文正則表達式匹配-正則中文匹配中文正則表達式匹配-正則中文匹配 js正則表達式匹配正則表達式之匹配中文漢字的正則表達式介紹【正則表達式】-python 正則表達式中匹配中文 js正則表達式的貪婪匹配和惰性匹配 PHP正則表達式匹配中文字符