【正則表達式】-python 正則表達式中匹配中文

本文轉載自查看原文 2021-11-12 19:59 1653

這篇文章主要講如何使用正則匹配中文字符，中文正則表達式的匹配規則不像其他正則規則一樣容易記住，下面一起看看這個中文正則表達式是怎么樣的。 w匹配的僅僅是中文，數字，字母，對於國人來講，僅匹配中文時常會用到，見下

[\u4e00-\u9fa5]

或許你也需要匹配雙字節字符，中文也是雙字節的字符

匹配雙字節字符(包括漢字在內)：[^x00-xff]

注：可以用來計算字符串的長度（一個雙字節字符長度計2，ASCII字符計1）更多常用正則表達式匹配規則：

英文字母:[a-zA-Z] 數字:[0-9]

匹配中文，英文字母和數字及_:
^[u4e00-u9fa5_a-zA-Z0-9]+$

同時判斷輸入長度：
[u4e00-u9fa5_a-zA-Z0-9_]{4,10}
^[wu4E00-u9FA5uF900-uFA2D]*$

1、一個正則表達式，只含有漢字、數字、字母、下划線不能以下划線開頭和結尾：

^(?!_)(?!.*?_$)[a-zA-Z0-9_u4e00-u9fa5]+$

其中： ^ 與字符串開始的地方匹配

(?!_)　　不能以_開頭

(?!.*?_$)　　不能以_結尾

[a-zA-Z0-9_u4e00-u9fa5]+　　至少一個漢字、數字、字母、下划線

$　　與字符串結束的地方匹配

放在程序里前面加@，否則需要\進行轉義 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_u4e00-u9fa5]+$"

（或者：@"^(?!_)w*(?<!_)$" 或者 @" ^[u4E00-u9FA50-9a-zA-Z_]+$ " )

2、只含有漢字、數字、字母、下划線，下划線位置不限：

^[a-zA-Z0-9_u4e00-u9fa5]+$

3、由數字、26個英文字母或者下划線組成的字符串

^w+$

4、2~4個漢字

@"^[u4E00-u9FA5]{2,4}$";

5、

^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python 正則表達式中匹配中文正則表達式中文匹配中文正則表達式匹配-正則中文匹配中文正則表達式匹配-正則中文匹配 Python 正則表達式匹配中文 Python 正則表達式匹配中文 python 正則表達式匹配中文 python正則表達式匹配中文日期時間 python 正則表達式匹配中文(轉) python2 正則表達式匹配中文的問題