Nodejs正則表達式概述
1. 概念
正則表達式描述了一種字符串匹配的模式,可以用來檢查一個字符串是否含有某種子串、將匹配的子串做替換或者從某個字符串中取出符合某個條件的子串的等。
2.創建正則表達式
方式一:字面量創建方式
var reg = /pattern/flags
方式二:構造函數實例創建方式
var reg = new RegExp(pattern, flags)
說明:
pattern 正則表達式
flags 標識(修飾符)
修飾符主要有:
i 忽略大小寫匹配
m 多行匹配(即在到達一行文本末尾時還會繼續尋找下一行中是否與正則匹配的項)
g 全局匹配(模式應用於所有的字符串),而非在找到第一個匹配項時停止
注意:
字面量創建方式特殊含義的字符不需要轉義,實例創建方式需要轉義
示例:
var reg1 = new RegExp('\d'); // 表示的 d (如果需要\,必須轉義\\)
var reg2 = new RegExp('\\d'); // 表示的 \d
var reg3 = /\d/; // 表示的 \d
3. 元字符
元字符主要分為代表特殊含義的字符與代表次數的量詞元字符
特殊含義的元字符
\d : 0-9之間的任意一個數字 \d只占一個位置
\w : 數字,字母 ,下划線 0-9 a-z A-Z _
\s : 空格或者空白等
\D : 除了\d
\W : 除了\w
\S : 除了\s
. : 除了\n之外的任意一個字符
\ : 轉義字符
| : 或者
() : 分組
\n : 匹配換行符
\b : 匹配邊界 字符串的開頭和結尾 空格的兩邊都是邊界 => 不占用字符串位數
^ : 限定開始位置 => 本身不占位置
$ : 限定結束位置 => 本身不占位置
[a-z] : 任意字母 []中的表示任意一個都可以
[^a-z] : 非字母 []中^代表除了
[abc] : abc三個字母中的任何一個 [^abc]除了這三個字母中的任何一個字符
次數的量詞元字符
* : 0到多個
+ : 1到多個
? : 0次或1次 可有可無
{n} : 正好n次;
{n,} : n到多次
{n,m} : n次到m次
4. Nodejs中和正則相關的一些方法
- reg.test(str) //用來驗證字符串是否符合正則 符合返回true 否則返回false
示例:
var str = 'hello';
var reg = /\w+/; // 模式:匹配1到多個的數字、字母、下划線
console.log(reg.test(str)); // true
- reg.exec() //用來捕獲符合規則的字符串
示例:
var str = 'tom287aaa879bbb666';
var reg = /\d+/;
console.log(reg.exec(str));
// 返回數組中 [0:"287", index:3, input:"tom287aaa879bbb666"]
// 0 : "123" 表示我們捕獲到的字符串
// index: 3 表示捕獲開始位置的索引
// input: tom287aaa879bbb666 表示原有的字符串
標識符 g 作用
var str = 'abc123cba456aaa789';
var reg = /\d+/g; //此時加了標識符g
console.log(reg.lastIndex) // lastIndex : 0
console.log(reg.exec(str)) // ["123", index: 3, input: "abc123cba456aaa789"]
console.log(reg.lastIndex) // lastIndex : 6
console.log(reg.exec(str)) // ["456", index: 9, input: "abc123cba456aaa789"]
console.log(reg.lastIndex) // lastIndex : 12
console.log(reg.exec(str)) // ["789", index: 15, input: "abc123cba456aaa789"]
console.log(reg.lastIndex) // lastIndex : 18
console.log(reg.exec(str)) // null
console.log(reg.lastIndex) // lastIndex : 0
注意:
每次調用exec方法時,捕獲到的字符串都不相同
lastIndex :這個屬性記錄的就是下一次捕獲從哪個索引開始。
當未開始捕獲時,這個值為0。
如果當前次捕獲結果為null。那么lastIndex的值會被修改為0.下次從頭開始捕獲。
而且這個lastIndex屬性還支持人為賦值。
- str.match(reg) 如果匹配成功,就返回匹配成功的數組,如果匹配不成功,就返回null
如果正則表達式沒有標識符 g 則exec與match功能一樣的
如果正則表達式有標識符 g 則exec與match有明顯區別
當全局匹配時,match方法會一次性把符合匹配條件的字符串全部捕獲到數組中,
如果想用exec來達到同樣的效果需要執行多次exec方法。
示例:
var str = 'abc123cba456aaa789';
var reg = /\d+/g;
console.log(reg.exec(str)); // ["123", index: 3, input: "abc123cba456aaa789"]
console.log(str.match(reg)); // ["123", "456", "789"]
- str.replace() 正則去匹配字符串,匹配成功的字符去替換成新的字符串
語法:str.replace(reg,newStr);
示例:
var str = 'b123bc456d';
var res = str.replace(/\d/g,'Q')
console.log(res) // "bQQQbcQQQd" 將所有的數字替換字符Q
5. 正則的特性 - 貪婪性 與 懶惰性
貪婪性
所謂的貪婪性就是正則在捕獲時,每一次會盡可能多的去捕獲符合條件的內容。
如果我們想盡可能的少的去捕獲符合條件的字符串的話,可以在量詞元字符后加?
懶惰性
懶惰性則是正則在成功捕獲一次后不管后邊的字符串有沒有符合條件的都不再捕獲。
如果想捕獲目標中所有符合條件的字符串的話,我們可以用標識符g來標明是全局捕獲
示例:
var str = '123aaa456';
var reg = /\d+/; //只捕獲一次,一次盡可能多的捕獲
var res = str.match(reg)
console.log(res) // ["123", index: 0, input: "123aaa456"]
reg = /\d+?/g; //解決貪婪性、懶惰性
res = str.match(reg)
console.log(res) // ["1", "2", "3", "4", "5", "6"]
6. 正則運算符的優先級
正則表達式從左到右進行計算,並遵循優先級順序,這與算術表達式非常類似。
相同優先級的會從左到右進行運算,不同優先級的運算先高后低。
下面是常見的運算符的優先級排列
依次從最高到最低說明各種正則表達式運算符的優先級順序:
\ : 轉義符
(), (?:), (?=), [] => 圓括號和方括號
*, +, ?, {n}, {n,}, {n,m} => 量詞限定符
^, $, \任何元字符、任何字符
| => 替換,"或"操作
字符具有高於替換運算符的優先級,一般用 | 的時候,為了提高 | 的優先級,我們常用()來提高優先級
如: 匹配 food或者foot的時候 reg = /foo(t|d)/ 這樣來匹配
