C#正則表達式


C#正則表達式

一、簡介

正則表達式 是一種匹配輸入文本的模式,.Net 框架提供了允許這種匹配的正則表達式引擎,模式由一個或多個字符、運算符和結構組成。下面列出了用於定義正則表達式的各種類別的常用字符、運算符和結構。

字符轉義:

正則表達式中的反斜杠字符(\)指示其后跟的字符是特殊字符,或應按原義解釋該字符。 

轉義字符 描述 模式 匹配
\a 與報警 (bell) 符 \u0007 匹配。 \a "Warning!" + '\u0007' 中的 "\u0007"
\b 在字符類中,與退格鍵 \u0008 匹配。 [\b]{3,} "\b\b\b\b" 中的 "\b\b\b\b"
\t 與制表符 \u0009 匹配。 (\w+)\t "Name\tAddr\t" 中的 "Name\t" 和 "Addr\t"
\r 與回車符 \u000D 匹配。(\r 與換行符 \n 不是等效的。) \r\n(\w+) "\r\nHello\nWorld." 中的 "\r\nHello"
\v 與垂直制表符 \u000B 匹配。 [\v]{2,} "\v\v\v" 中的 "\v\v\v"
\f 與換頁符 \u000C 匹配。 [\f]{2,} "\f\f\f" 中的 "\f\f\f"
\n 與換行符 \u000A 匹配。 \r\n(\w+) "\r\nHello\nWorld." 中的 "\r\nHello"
\e 與轉義符 \u001B 匹配。 \e "\x001B" 中的 "\x001B"
\ nnn 使用八進制表示形式指定一個字符(nnn 由二到三位數字組成)。 \w\040\w "a bc d" 中的 "a b" 和 "c d"
\x nn 使用十六進制表示形式指定字符(nn 恰好由兩位數字組成)。 \w\x20\w "a bc d" 中的 "a b" 和 "c d"
\c X \c x 匹配 X 或 x 指定的 ASCII 控件字符,其中 X 或 x 是控件字符的字母。 \cC "\x0003" 中的 "\x0003" (Ctrl-C)
\u nnnn 使用十六進制表示形式匹配一個 Unicode 字符(由 nnnn 表示的四位數)。 \w\u0020\w "a bc d" 中的 "a b" 和 "c d"
\ 在后面帶有不識別的轉義字符時,與該字符匹配。 \d+[\+-x\*]\d+\d+[\+-x\*\d+ "(2+2) * 3*9" 中的 "2+2" 和 "3*9"

 字符類:

字符類與一組字符中的任何一個字符匹配。

字符類 描述 模式 匹配
[character_group] 匹配 character_group 中的任何單個字符。 默認情況下,匹配區分大小寫。 [mn] "mat" 中的 "m","moon" 中的 "m" 和 "n"
[^character_group] 非:與不在 character_group 中的任何單個字符匹配。 默認情況下,character_group 中的字符區分大小寫。 [^aei] "avail" 中的 "v" 和 "l"
[ first - last ] 字符范圍:與從 first 到 last 的范圍中的任何單個字符匹配。 [b-d] [b-d]irds 可以匹配 Birds、 Cirds、 Dirds
. 通配符:與除 \n 之外的任何單個字符匹配。 
若要匹配原意句點字符(. 或 \u002E),您必須在該字符前面加上轉義符 (\.)。
a.e "have" 中的 "ave", "mate" 中的 "ate"
\p{ name } 與 name 指定的 Unicode 通用類別或命名塊中的任何單個字符匹配。 \p{Lu} "City Lights" 中的 "C" 和 "L"
\P{ name } 與不在 name 指定的 Unicode 通用類別或命名塊中的任何單個字符匹配。 \P{Lu} "City" 中的 "i"、 "t" 和 "y"
\w 與任何單詞字符匹配。 \w "Room#1" 中的 "R"、 "o"、 "m" 和 "1"
\W 與任何非單詞字符匹配。 \W "Room#1" 中的 "#"
\s 與任何空白字符匹配。 \w\s "ID A1.3" 中的 "D "
\S 與任何非空白字符匹配。 \s\S "int __ctr" 中的 " _"
\d 與任何十進制數字匹配。 \d "4 = IV" 中的 "4"
\D 匹配不是十進制數的任意字符。 \D "4 = IV" 中的 " "、 "="、 " "、 "I" 和 "V"

分組構造:

分組構造描述了正則表達式的子表達式,通常用於捕獲輸入字符串的子字符串。

分組構造 描述 模式 匹配
( subexpression ) 捕獲匹配的子表達式並將其分配到一個從零開始的序號中。 (\w)\1 "deep" 中的 "ee"
(?< name >subexpression) 將匹配的子表達式捕獲到一個命名組中。 (?< double>\w)\k< double> "deep" 中的 "ee"
(?< name1 -name2 >subexpression) 定義平衡組定義。 (((?'Open'\()[^\(\)]*)+((?'Close-Open'\))[^\(\)]*)+)*(?(Open)(?!))$ "3+2^((1-3)*(3-1))" 中的 "((1-3)*(3-1))"
(?: subexpression) 定義非捕獲組。 Write(?:Line)? "Console.WriteLine()" 中的 "WriteLine"
(?imnsx-imnsx:subexpression) 應用或禁用 subexpression 中指定的選項。 A\d{2}(?i:\w+)\b "A12xl A12XL a12xl" 中的 "A12xl" 和 "A12XL"
(?= subexpression) 零寬度正預測先行斷言。 \w+(?=\.) "He is. The dog ran. The sun is out." 中的 "is"、 "ran" 和 "out"
(?! subexpression) 零寬度負預測先行斷言。 \b(?!un)\w+\b "unsure sure unity used" 中的 "sure" 和 "used"
(?<=subexpression) 零寬度正回顧后發斷言。 (?<=19)\d{2}\b "1851 1999 1950 1905 2003" 中的 "99"、"50"和 "05"
(?<! subexpression) 零寬度負回顧后發斷言。 (?<!wo)man\b "Hi woman Hi man" 中的 "man"
(?> subexpression) 非回溯(也稱為"貪婪")子表達式。 [13579](?>A+B+) "1ABB 3ABBC 5AB 5AC" 中的 "1ABB"、 "3ABB" 和 "5AB"

限定符
限定符指定在輸入字符串中必須存在上一個元素(可以是字符、組或字符類)的多少個實例才能出現匹配項。 限定符包括下表中列出的語言元素。 

限定符 描述 模式 匹配
* 匹配上一個元素零次或多次。 \d*\.\d ".0"、 "19.9"、 "219.9"
+ 匹配上一個元素一次或多次。 "be+" "been" 中的 "bee", "bent" 中的 "be"
? 匹配上一個元素零次或一次。 "rai?n" "ran"、 "rain"
{ n } 匹配上一個元素恰好 n 次。 ",\d{3}" "1,043.6" 中的 ",043", "9,876,543,210" 中的 ",876"、 ",543" 和 ",210"
{ n ,} 匹配上一個元素至少 n 次。 "\d{2,}" "166"、 "29"、 "1930"
{ n , m } 匹配上一個元素至少 n 次,但不多於 m 次。 "\d{3,5}" "166", "17668", "193024" 中的 "19302"
*? 匹配上一個元素零次或多次,但次數盡可能少。 \d*?\.\d ".0"、 "19.9"、 "219.9"
+? 匹配上一個元素一次或多次,但次數盡可能少。 "be+?" "been" 中的 "be", "bent" 中的 "be"
?? 匹配上一個元素零次或一次,但次數盡可能少。 "rai??n" "ran"、 "rain"
{ n }? 匹配前導元素恰好 n 次。 ",\d{3}?" "1,043.6" 中的 ",043", "9,876,543,210" 中的 ",876"、 ",543" 和 ",210"
{ n ,}? 匹配上一個元素至少 n 次,但次數盡可能少。 "\d{2,}?" "166"、 "29" 和 "1930"
{ n , m }? 匹配上一個元素的次數介於 n 和 m 之間,但次數盡可能少。 "\d{3,5}?" "166", "17668", "193024" 中的 "193" 和 "024"

二、代碼

 static void Main(string[] args)
        {
            //判斷是否包含a、b、c三個字符
            string str = Console.ReadLine();                //把用戶輸入的字符存入 str
            string regex = @"[abc]";                          //C#中 加@"[abc]" 為正則表達式基本寫法
            bool isMatch = Regex.IsMatch(str, regex);         //比較: IsMatch(需要判斷的字符,正則):返回bool值 
            Console.WriteLine(isMatch ? "Match [abc]" : "not Match[abc]"); //輸出結果
            Console.WriteLine();
        }
是否包含a、b、c
  static void Main(string[] args)
        {
            StringBuilder s = new StringBuilder("www.baidu.com", 50); //聲明一個字符串,容量50

            //news=正則類.替換字符串(需要處理的字符串,正則,添加的字符串)—— 把符合正則情況的位置,替換為 后邊字符串
            //替換開頭
            string news = Regex.Replace(s.ToString(), "^", "網址:"); //^ :代表開頭
            Console.WriteLine(news);                               //輸出

            //替換結尾
            news = Regex.Replace(s.ToString(), "$", "結尾"); //$:代表結尾
            Console.WriteLine(news);
            Console.ReadLine();
        }
替換正則開頭或結尾
 static void Main(string[] args)
        {
            string s = Console.ReadLine();           //s接收用戶輸入
            string regex = @"^\W*$";                 //正則:以任意除字母、下划線、數字以外的字符開頭和結尾的
            bool isMatch = Regex.IsMatch(s, regex);  //匹配用戶輸入,是否滿足正則條件
            Console.WriteLine(isMatch ? "滿足" : "不滿足"); //三目運算
            Console.WriteLine();
        }
匹配以任意除字母、下划線、數字以外的字符開頭和結尾的
  static void Main(string[] args)
        {
            string s = "abcdef";
            string regex = @"[^bde]";                    //[^bde]代表了除 b、d、e之外的所有字符,任意一個字符
            string newReplace = Regex.Replace(s, regex, "1"); //匹配 s 中,除了bde之外的字符,替換為 1
            Console.WriteLine(newReplace);
            Console.WriteLine();
        }
替換字符
 static void Main(string[] args)
        {
            string qq = Console.ReadLine();       //等待用戶輸入
            string regex = @"^\d{5,11}$";         //正則:開頭結尾都是數字,並且5-11位都為數字
            bool isqq = Regex.IsMatch(qq, regex); //判斷並返回布爾值
            Console.WriteLine(isqq ? "是QQ號" : "不是QQ號"); //三目運算
            Console.WriteLine();
        }
匹配QQ號
static void Main(string[] args)
        {
            string regex = @"^((([1]?\d\d?|2[0-4]\d|25[0-5])\.){3}([1]?\d\d?|2[0-4]\d|25[0-5]))$"; //判斷IP地址是否合規
            while (true)
            {
                string s = Console.ReadLine();                 //等待用戶輸入
                bool isMatch = Regex.IsMatch(s, regex);        //驗證ip是否合法
                Console.WriteLine(isMatch ? "是IP地址" : "不是IP地址"); //三目運算
            }
        }
驗證IP地址


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM