
g是模式修正符,表示在整個字符串里多次查找
match方法來找到和reg正則相匹配的內容
"ab23839cd".match(/\d+/)
空白\s(包括空格回車制表符等)
\f匹配換頁符,\n匹配換行符,\r匹配回車,\t匹配制表符,\v匹配垂直制表符。
\s匹配單個空格,等同於[\f\n\r\t\v]。例如:
例1:
var reg = /\s.+/;
var str='This is a test String.';
alert(reg.exec(str));
返回“is a test String.”,正則的意思是匹配第一個空格以及其后的所有非換行字符。
同樣,\S表示非空格字符。
例2:
var reg = /\S+/;
var str='This is a test String.';
alert(reg.exec(str));
匹配結果為This,當遇到第一個空格之后,正則就停止匹配了。
在正則中最常用到的一個是:
例3:var reg=/^\s*$/; //匹配任意空或空白字符,如果你什么也沒輸入,或輸入的只有空格、回車、換行等字符,則匹配成功。這樣就可以驗證用戶是否正確輸入內容了。
這個用來驗證輸入框里是否寫了有效效字符,用法如下:
var reg=/^\s*$/;
if(reg.test(value)){
alert('請輸入有效值');
return false;
}
單字符\w
\w表示單詞字符,等同於字符集合[a-zA-Z0-9_]。例如:
var reg = /\w+/;
var str='zhufengpeixun';
alert(reg.exec(str));
返回完整的zhufengpeixun字符串,因為所有字符都是單詞字符。
var reg = /\w+/;
var str='.className';
alert(reg.exec(str));
結果顯示匹配了字符串中的className,只有第一個“.”唯一的非單詞字符沒有匹配。
var reg = /\w+/;
var str='正則教程';
alert(reg.exec(str));
試圖用單詞字符去匹配中文自然行不通了,返回 null。
\W表示非單詞字符,等效於[^a-zA-Z0-9_]
var reg = /\W+/;
var str='正則教程';
alert(reg.exec(str));
返回完整的字符串,因為,中文算作是非單詞字符。
分組和分組的引用
請見在線視頻的正則專題部分的
正則表達式基礎第三講:分組、分組的引用、選擇等http://online.zhufengpeixun.cn/viewCourseDetail.do?courseId=141415
形式如下:/(子正則表達式)\1/ 依舊用例子來說明:
1.例子
var reg = /\w/;
var str='zhufengpeixun';
alert(reg.exec(str));
//返回z。
2.例子
var reg = /(\w)(\w)/;
var str='zhufengpeixun';
alert(reg.exec(str));
返回zh,z,h ,zh是整個正則匹配的內容,z是第一個括號里的子正則表達式匹配的內容,h是第二個括號匹配的內容。
3.例子
var reg = /(\w)\1/;
var str='zhufengpeixun';
alert(reg.exec(str));
則會返回null。這里的“\1”就叫做反向引用,它表示的是第一個括號內的子正則表達式匹配的內容。在上面的例子中,第一個括號里的(\w)匹配了z,因此“\1”就同樣表示z了,在余下的字符串里自然找不到z了。與第二個例子對比就可以發現,“\1”是等同於“第1個括號匹配的內容”,而不是“第一個括號的內容”。
var reg = /(\w)\1/;
var str='bbs.zhufengpeixun.cn';
alert(reg.exec(str));
這個正則則會匹配到bb,b。同樣,前面有幾個子正則表達式我們就可以使用幾個反向引用。例如:
var reg = /(\w)(\w)\2\1/;
var str='woow';
alert(reg.exec(str));
會匹配成功,因為第一個括號匹配到w,第二個括號匹配到o,而\2\1則表示ow,恰好匹配了字符串的最后兩個字符。
括號() ,表示子表達式,也叫分組
前面我們曾經討論過一次括號的問題,見下面這個例子:
var reg = /^(b|c).+/;
var str='bbs.blueidea.com';
alert(reg.exec(str));
這個正則是為了實現只匹配以b或者c開頭的字符串,一直匹配到換行字符,但是。上面我們已經看到了,可以使用“\1”來反向引用這個括號里的子正則表達式所匹配的內容。而且exec方法也會將這個字正則表達式的匹配結果保存到返回的結果中。
不記錄子正則表達式的匹配結果[匹配不捕獲]
使用形如(?:pattern)的正則就可以避免保存括號內的匹配結果。例如:
var reg = /^(?:b|c).+/;
var str='bbs.blueidea.com';
alert(reg.exec(str));
可以看到返回的結果不再包括那個括號內的字正則表達式多匹配的內容。同理,反向引用也不好使了:
var reg = /^(b|c)\1/;
var str='bbs.zhufengpeixun.cn';
alert(reg.exec(str));
返回bb,b。bb是整個正則表達式匹配的內容,而b是第一個子正則表達式匹配的內容。
var reg = /^(?:b|c)\1/;
var str='bbs.zhufengpeixun.cn';
alert(reg.exec(str));
返回null。由於根本就沒有記錄括號內匹配的內容,自然沒有辦法反向引用了。
正向預查
形式:(?=pattern)所謂正向預查,意思就是:要匹配的字符串,后面必須緊跟着pattern! 我們知道正則表達式/cainiao/會匹配cainiao。同樣,也會匹配cainiao9中的cainiao。但是我們可能希望,cainiao只能匹配cainiao8中的cainiao。這時候就可以像下面這樣寫:/cainiao(?=8)/,看兩個實例:
var reg = /cainiao(?=8)/;
var str='cainiao9';
alert(reg.exec(str));
//返回null。
var reg = /cainiao(?=8)/;
var str='cainiao8';
alert(reg.exec(str));
匹配cainiao。需要注意的是,括號里的內容並不參與真正的匹配,只是檢查一下后面的字符是否符合要求而已,例如上面的正則,返回的是cainiao,而不是cainiao8。
再來看幾個例子:
var reg = /zhufeng(?=peixun)/;
var str='zhufengpeixun';
alert(reg.exec(str));
匹配到zhufeng,而不是peixun。
var reg = /zhufeng(?=peixun)/;
var str=’zhufengonline’;
alert(reg.exec(str));
返回null,因為zhufeng后面不是peixun。
var reg = /zhufeng(?=peixun)/;
var str='onlinepeixun';
alert(reg.exec(str));
同樣返回null。
?!
形式(?!pattern)和?=恰好相反,要求字符串的后面不能緊跟着某個pattern,還拿上面的例子:
var reg = /zhufeng(?!js)/;
var str=`zhufengjs`;
alert(reg.exec(str));
返回null,因為正則要求,zhufeng的后面不能是js。
var reg = /zhufeng(?!js)/;
var str='zhufengpeixun';
alert(reg.exec(str));
則成功返回zhufeng。
匹配元字符
首先要搞清楚什么是元字符呢?我們之前用過*,+,?之類的符號,它們在正則表達式中都有一定的特殊含義,類似這些有特殊功能的字符都叫做元字符。例如
var reg = /c*/;
表示有任意個c,但是如果我們真的想匹配c*這個字符串的時候怎么辦呢?只要將*轉義了就可以了,如下:
var reg = /c\*/;
var str='c*';
alert(reg.exec(str));
返回匹配的字符串:c*。
同理,要匹配其他元字符,只要在前面加上一個“\”就可以了。
正則表達式的修飾符
全局匹配,修飾符g
形式:/pattern/g 例子:reg = /b/g; 后面再說這個g的作用。先看后面的兩個修飾符。不區分大小寫,修飾符i
形式:/pattern/i 例子:
var reg = /b/;
var str = 'BBS';
alert(reg.exec(str));
返回null,因為大小寫不符合。
var reg = /b/i;
var str = 'BBS';
alert(reg.exec(str));
匹配到B,這個就是i修飾符的作用了。
行首行尾,修飾符m
形式:/pattern/m m修飾符的作用是修改^和$在正則表達式中的作用,讓它們分別表示行首和行尾。例如:
var reg = /^b/;
var str = 'test\nbbs';
alert(reg.exec(str));
匹配失敗,因為字符串的開頭沒有b字符。但是加上m修飾符之后:
var reg = /^b/m;
var str = 'test\nbbs';
alert(reg.exec(str));;
匹配到b,因為加了m修飾符之后,^已經表示行首,由於bbs在字符串第二行的行首,所以可以成功地匹配。
匹配固定的n個 c{n}
{1}表示一個的意思。/c{1}/只能匹配一個c,和/c/是一個意思,一般匹配只出現一次的字符,后邊的{1}就不寫了。/c{2}/則會匹配兩個連續的c。以此類推, /c{n}/則會匹配n個連續的c。看下面的例子:
var reg = /c{1}/;
var str='china_zhufengpeixun';
alert(reg.exec(str));
//輸出結果是:c
var reg = /o{2}/;
var str='money';
alert(reg.exec(str));
//返回結果`null`,表示沒有匹配成功。
reg = /o{2}/;
str='good food';
alert(reg.exec(str))
//輸出結果oo。(其實是第一組oo,不會匹配到第二組oo,因為正則的匹配是懶惰的,不加模式匹配符g,則表示只去匹配一次,匹配到了則返回並且停止。
如果寫成
reg=/o{2}/g;
alert(str.match(reg))
//則輸出oo,oo了
c{m,n} 匹配最少m個,最多n個
c{3,4}的意思是,連續的3個c或者4個c。例如:
reg = /o{3,4}/;// (匹配三到四個o)
str='good正則教程';
alert(reg.exec(str));
返回結果null,表示沒有匹配成功。例:
reg = /o{3,4}/;
str='goood正則教程';
alert(reg.exec(str));
彈出結果是:ooo。例:
reg = /o{3,4}/;
str='very gooood正則教程';
alert(reg.exec(str));
輸出的結果是:oooo,這表明正則會盡量多匹配,可3可4的時候它會選擇多匹配一個。(這就是貪婪匹配)例:
reg = /c{3,4}/;
str='cccccTest';
alert(reg.exec(str));
仍然會匹配4個c。
由以上例子可以推斷出:c{m,n}表示m到n個c,且m小於等於n。
c{n,}表示最少匹配n個c,最多不限制
c{1,}表示1個以上的c,相當於+。如下:
例:
reg = /c{1,}/;str='cainiao';
alert(reg.exec(str));
//結果彈出c。
例:
reg = /c{1,}/;
str='cccccTest';
alert(reg.exec(str));
//返回ccccc,再次說明了正則表達式會盡量多地匹配。
例:
reg = /c{2,}/;
str='cainiao';
alert(reg.exec(str));
結果返回null,c{2,}表示2個以上的c,而cainiao中只有1個c。
由以上例子可知,c{n,}表示最少n個c,最多則不限個數。
綜合:*,+,?
*表示0次或者多次,等同於{0,},即c* 和c{0,} 是一個意思。
+表示一次或者多次,等同於{1,},即c+ 和c{1,} 是一個意思。
最后,?表示0次或者1次,等同於{0,1},即c? 和c{0,1} 是一個意思。
貪心與非貪心【貪婪匹配和非貪婪匹配】
人都是貪婪的,正則也是如此。我們在例子reg = /c{3,4}/;str='ccccTest';的例子中已經看到了,能匹配四個的時候,正則絕對不會去匹配三個。上面所介紹的所有的正則都是這樣,只要在合法的情況下,它們會盡量多去匹配字符,這就叫做貪心模式。如果我們希望正則盡量少地匹配字符,那么就可以在表示數字的符號后面加上一個?(即:問號加在量詞的后邊,則表示非貪婪匹配)。組成如下的形式:
{n,}?, *?, +?, ??, {m,n}?
例:
reg = /c{1,}?/;
str='ccccc';
alert(reg.exec(str));
返回的結果只有1個c,盡管有5個c可以匹配,但是由於正則表達式是非貪心模式,所以只會匹配一個。
/^開頭,結尾$/ 【表示位置】
^表示只匹配字符串的開頭。看下面的例子:
例1:
reg = /^c/;
str='維生素c';
alert(reg.exec(str));
結果為null,因為字符串‘維生素c’的開頭並不是c,所以匹配失敗。
例2:
reg = /^z/;
str='zhufengpeixun';
alert(reg.exec(str));;
這次則返回c,匹配成功,因為cainiao恰恰是以z開頭的。
與^相反,$則只匹配字符串結尾的字符,同樣,看例子:
例3:
reg = /z$/;
str='zhufengpeixun';
alert(reg.exec(str));
輸出null,表示正則表達式沒能在字符串的結尾找到z這個字符。
例4:
reg = /d$/;
str='正則教程good';
alert(reg.exec(str));
這次返回的結果是d,表明匹配成功。
元字符點’.’的用法
.會匹配字符串中除了換行符\n之外的所有字符,例如
reg = /./; //一個點表示匹配字符串中出現的第一個非換行符字符。
str='zhufengpeixun';
alert(reg.exec(str));;
結果顯示,正則匹配到了字符z。
reg = /./;
str='online.zhufengpeixun';
alert(reg.exec(str));
這次是o,只要有一個是非換行字符,就表示匹配成功,就不會往下再繼續了。
reg = /.+/;
str='zhufengpeixun_ 前端開發權威培訓';
alert(reg.exec(str));
結果是“zhufengpeixun_前端開發“也就是說所有的字符都被匹配掉了,包括一個空格,一個下滑線
【貪婪匹配】。
例1:
reg = /.+/;
str='online.zhufengpeixun.cn';
alert(reg.exec(str));;
同樣,直接返回整個字符串——online.zhufengpeixun.cn,可見”.”也匹配”.”本身。
例2:
reg = /^./; //這樣表示必須以非換行符開始。
str='\nzhufengpeixun';
alert(reg.exec(str));
結果是null,終於失敗了,正則要求字符串的第一個字符不是換行,但是恰恰字符是以\n開始的。
“|“,正則表達式中的或,把“|”左右兩邊的一到多個字符當成一個整體對待
b|c表示,匹配b或者c(這里相當於[bc])。ab|ac表示匹配ab或ac(但這里不相當於[abc],[]表示在一組字符中任選一個)。
例1:
/z|o/.exec('zhufengpeixun'))
//結果是z。
例2:
/z|o/.exec('online');
//結果是o。
例3:
/^z|o.+/.exec('online');
//匹配掉整個online。
例4:
/^z|o.+/.exec('zhufengpeixun.cn');
//結果只有一個z,而不是整個字符串。因為上面正則表達式的意思是,匹配開頭的z或者是o.+。
和括號結合使用
例:
/^(z|o).+/.exec('zhufengpeixun');
這次的結果是整個串zhufengpeixun,加上上面的括號這后,這個正則的意思是,如果字符串的開頭是z或者o,那么匹配開頭的z或者o以及其后的所有的非換行字符。如果你也實驗了的話,會發現返回的結果后面多出來一個“z“,這是()內的z|o所匹配的內容(這個叫分組或子正則)。我們在正則表達式內括號里寫的內容會被認為是子正則表達式,所匹配的結果也會被記錄下來供后面使用。我們暫且不去理會這個特性。
方括號的作用:[]
[abc]表示a或者b或者c中的任意一個字符。
例:
var reg = /^[abc]/;
//這個有點像/^(a|b|c)/
str='bbs.zhufengpeixun.cn';
alert(reg.exec(str));;
//返回結果是b。
例:
reg = /^[abc]/;
str='test';
alert(reg.exec(str));
//這次的結果就是null了。
我們在字字符集合中使用如下的表示方式:[a-z],[A-Z],[0-9],分別表示小寫字母,大寫字母,數字。例如:
reg = /^[a-zA-Z][a-zA-Z0-9_]+/;
//后面這個其實這個就是元字符\w表示的含意
str='test';
alert(reg.exec(str));
//結果是整個test,正則的意思是開頭必須是英文字母,后面可以是英文字母或者數字以及下划線。
關於正則中的連續字符
在正則中/[0-9]/表示匹配字符從0到9中的任意一個,/[a-z]/表示匹配從a到z中的任意一個字母只要是在ASCII碼表里連續出現的字符,都可以用這樣的表示法。
請百度一下“ASCII碼表”,參照里面字符出現的順序和對應的16進制或10進制的編碼。
比如var reg=/^[!-z]$/; 就會匹配從字符“!”開始,到字符“z”結束的任意一個字符。
var reg=/^[!-z]$/;
alert(reg.test("8"));//true,
alert(reg.test("*"))//true,
alert(reg.test("}"))//false,因為"}"不在從!到z的這個范圍內
正則/^[!-z]$/也可以用16進制來表示。如果用16進制表示,則需要用\u開頭,表示這是在以16進制的方式定義unicode字符,並且后邊的16進制的編碼要寫成四位,不足4位的前邊補0。則上邊的那個正則,也可以寫成
var reg=/^[\u0021-\u007a]$/;
// 字符“!”對應的16進制編碼是21,字符“z”的16進制編碼是7a。
這種方式。中文是擴展的ASCII字符編碼,匹配UTF8中文的正則是:/^[\u4e00-\u9fa5]+$/
php中utf-8編碼下用正則表達式匹配漢字的正則是:/^[\x{4e00}-\x{9fa5}]+$/u
注意:寫成[1-13]不是表示從數字1到數字13,而是表示從1到1和3,也就是1和3。因為正則里是在表示連續出現的字符,而不是數字。
反字符集合[^abc]
^在正則表達式開始部分的時候表示開頭的意思,例如/^c/表示開頭是c;但是在字符集和中,它表示的是類似“非“的意思,例如[^abc]就表示不能是a,b或者c中的任何一個。例如:
var reg = /[^abc]/;
var str='blueidea';
alert(reg.exec(str));
返回的結果是l,因為它是第一個非abc的字符(即第一個b沒有匹配)。同樣:
例:
var reg = /[^abc]/;
var str='cbazhufengpeixun';
alert(reg.exec(str));
輸出z,前三個字符都是[abc]集合中的。由此我們可知:[^0-9]表示非數字,[^a-z]表示非小寫字母,依次類推。
邊界與非邊界
\b表示的邊界的意思,也就是說,只有字符串的開頭和結尾才算數。例如/\bc/就表示字符串開始的c。看下面的例子:
/\bc/.exec('cainiao');
//返回結果c。匹配到了左邊界的c字符。
/\bc/.exec('???c');
//仍然返回c,不過這次返回的是右側邊界的c。
/\bc/.exec('bcb');
//這次匹配失敗,因為bcb字符串中的c被夾在中間,既不在左邊界也不再右邊界。
與\b對應\B表示非邊界。例如:
/\Bc/.exec('bcb');
//這次會成功地匹配到bcb中的c,。然而
/\Bc/.exec('cainiao');
//則會返回null。因為\B告訴正則,只匹配非邊界的c。
數字與非數字
\d表示數字的意思,相反,\D表示非數字。
例:
/\d/.exec('cainiao8')
//返回的匹配結果為8,因為它是第一個數字字符。
例:
/\D/.exec('cainiao8');
//返回c,第一個非數字字符。
轉自: https://segmentfault.com/a/1190000002471140
作者: sutaking
