【正則表達式】 - 匹配中文字符

本文轉載自查看原文 2022-02-27 11:40 1265 正則表達式

網上搜索到“[\u4e00-\u9fa5]”匹配所有中文字符，實際測試結果是把數字、英文、中文全部匹配了，不知道怎么回事，百度搜索到的匹配中文字符方法都是這樣的。

於是去翻舍得的正則表達式實用教程，原來是這么簡單！ “[[:unicode:]]” （不含分號）就可以匹配中文字符了！在此感謝舍得！

[[:unicode:]]

[[:unicode:]]+

\w匹配的僅僅是中文，數字，字母，對於國人來講，僅匹配中文時常會用到，見下

匹配中文字符的正則表達式： [\u4e00-\u9fa5]

匹配中文，英文字母和數字及_:

^[\u4e00-\u9fa5_a-zA-Z0-9]+$

同時判斷輸入長度：·

[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}

^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$

1、一個正則表達式，只含有漢字、數字、字母、下划線不能以下划線開頭和結尾：

^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$

或許你也需要匹配雙字節字符，中文也是雙字節的字符

匹配雙字節字符(包括漢字在內)：[^\x00-\xff]

其中：

^ 與字符串開始的地方匹配

(?!_)　　不能以_開頭

(?!.*?_$)　　不能以_結尾

[a-zA-Z0-9_\u4e00-\u9fa5]+　　至少一個漢字、數字、字母、下划線

$　　與字符串結束的地方匹配

放在程序里前面加@，否則需要\\進行轉義 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$"

（或者：@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " )

2、只含有漢字、數字、字母、下划線，下划線位置不限：

^[a-zA-Z0-9_\u4e00-\u9fa5]+$

3、由數字、26個英文字母或者下划線組成的字符串

^\w+$

4、2~4個漢字

@"^[\u4E00-\u9FA5]{2,4}$";

5、

//code from http://caibaojian.com/zhongwen-regexp.html
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 PHP正則表達式匹配中文字符中文字符匹配js正則表達式 C#匹配中文字符串的4種正則表達式正則表達式判斷中文字符正則表達式匹配中文字符及標點 PHP 正則表達式匹配中文字符 python中正則表達式在中文字符串匹配時的坑 Python中使用中文正則表達式匹配指定的中文字符串 Python從文件中讀取字符串，用正則表達式匹配中文字符的問題匹配中文字符的正則表達式： [/u4e00-/u9fa5]