Java 正則表達式 量詞 --- 三種匹配模式【貪婪型、勉強型、占有型】


1、Greediness(貪婪型):最大匹配
X?、X*、X+、X{n,}都是最大匹配。例如你要用“<.+>”去匹配“a<tr>aava</tr>abb”,也許你所期待的結果是想匹配“<tr>”,但是實際結果卻會匹配到“<tr>aava</tr>”。這是為什么呢?下面我們跟蹤下最大匹配的匹配過程。
①“<”匹配字符串的“<”。②“.+”匹配字符串的“tr>aava</tr>ab”,在進行最大匹配時,它把兩個“>”都匹配了,它匹配了所有字符,直到文本的最后字符“b”③這時,發現不能成功匹配“>”,開始按原路回退,用“a”與“>”匹配,直到“ab”前面的“>”匹配成功。
2、Reluctant(Laziness)(勉強型):最小匹配
     X?、X*、X+、X{n,}都是最大匹配。好,加個?就成了Laziness匹配。例如X??、X*?、X+?、X{n,}?都是最小匹配,其實X{n,m}?和X{n }?有些多余。
最小匹配意味者,.+? 匹配一個字符后,馬上試一試>的匹配可能,失敗了,則.+?再匹配一個字符,再馬上試一試>的匹配可能。JDK文檔中Greedy 和Reluctant,它是以eat一口來隱喻的,所以翻譯成貪吃和(勉強的)厭食最貼切了。不過我喜歡最大匹配、最小匹配的說法。
3、Possessive(占有型):完全匹配

與最大匹配不同,還有一種匹配形式:X?+、X*+、X++、X{n,}+等,成為完全匹配。它和最大匹配一樣,一直匹配所有的字符,直到文本的最后,但它不由原路返回。也就是說,一口匹配,搞不定就算了,到也干脆,偶喜歡。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM