網上搜索到“[\u4e00-\u9fa5]”匹配所有中文字符,實際測試結果是把數字、英文、中文全部匹配了,不知道怎么回事,百度搜索到的匹配中文字符方法都是這樣的。
於是去翻舍得的正則表達式實用教程,原來是這么簡單! “[[:unicode:]]” (不含分號)就可以匹配中文字符了!在此感謝舍得!
[[:unicode:]]
[[:unicode:]]+
\w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下
匹配中文字符的正則表達式: [\u4e00-\u9fa5]
匹配中文,英文字母和數字及_:
^[\u4e00-\u9fa5_a-zA-Z0-9]+$
同時判斷輸入長度:·
[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10} ^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$
1、一個正則表達式,只含有漢字、數字、字母、下划線不能以下划線開頭和結尾:
^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$
或許你也需要匹配雙字節字符,中文也是雙字節的字符
匹配雙字節字符(包括漢字在內):[^\x00-\xff]
其中:
^ 與字符串開始的地方匹配
(?!_) 不能以_開頭 (?!.*?_$) 不能以_結尾 [a-zA-Z0-9_\u4e00-\u9fa5]+ 至少一個漢字、數字、字母、下划線
$ 與字符串結束的地方匹配
放在程序里前面加@,否則需要\\進行轉義 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$" (或者:@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " )
2、只含有漢字、數字、字母、下划線,下划線位置不限:
^[a-zA-Z0-9_\u4e00-\u9fa5]+$
3、由數字、26個英文字母或者下划線組成的字符串
^\w+$
4、2~4個漢字
@"^[\u4E00-\u9FA5]{2,4}$";
5、
//code from http://caibaojian.com/zhongwen-regexp.html ^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$