在正則表達式中,許多標點符號具有特殊含義,比較難記,現歸納備個份:
這些符號有:^ $ . * + - ? = ! : | \ / ( ) [ ] { }
1.“[ ]”表示字符類: 即括號里是個字符集:如/[abc]/,表示和含有a,b,c任何一個字母的字符串都匹配。
注:特殊字符類:\s表示空格符、制表符、Unicode空白符。\S表示非Unicode空白符。(也可自定義Unicode字符類:如:
/[\u4E00-\u9FA5]/表示只匹配中文字符。)
\w 任何單字字符,相當於[a-zA-X0-9_];\W與\w相反。
\d 任何數字,相當於[0-9];\D與\w相反。
\b在字符類中使用表示退格符。[\b]則表示退格直接量。\b可以用來指定匹配位置,也可稱為錨;如:
查找一個句子里的單詞 java , 可以使用/\bjava\b/;\B與其相反。
2.“-"表示連字符,如[a-z];
3."."表示除換行符和其他Unicode行終止符之外的任意字符。
4."^"具有兩重含義:開始標記和非,如:/^a/表示以a開始的字符,當在[]中時:/[^a]/表示非a的所有字符。
5."$"表示字符結尾。如:/^abc$/表示以c結束的字符。
6.”{}"表示重復上一項。如/\d{2,4}/表示數字出現兩次,最多出現4次。如/3{2,4}/匹配33...;333....;3333.....;不匹配3和4個3相連以上的了。它的三種格式如下{n,m}表示至少3次,最多m次;{n,}至少n次;{n}恰好n次。
7."?"表示{0,1}。
8."+"表示{1,}。
9."*"表示{0,}。
注:非貪婪的重復(如??,+?,*?,{1,5}?只匹配第一個。)
10."|"表示分割,即或的含義。如:/ab|cd|ef/匹配含有ab或cd或ef的字符串。
11."()"包含三重用途:一是定義子表達式。二是在完整的模式中定義子模式。三是子表達式的引用。
子模式的定義可以從目標串中抽取和括號中的子模式相匹配的部分。
子模式的表達式的引用是指:可識別子模式的編號,提取它。如/(abc)\sis\s(string\w*)/;里面含有兩個字表達式:可通過
\1指(abc);\2指(string\w*); 應用如:/['"][^'"]*['"]/不能取前后同樣的引號,可以這樣寫:/[('")[^'"]*\1]/,可起到約束作用。
注:若想()里的不想被記憶,可采用(?:.....),將不會對其編號。
還有(?=p),(?!p)如下:
如/(javascript)?(?=\:)/ 表示匹配javascript:,但不包含:;它不匹配javascript,因為他有個條件就是后要接:;
(?!p)反前向聲明,要求接下來的字符不與模式p匹配,與(?=p)相反。
轉自: http://www.cnblogs.com/devcjq/articles/2920112.html