一.第三方框架RegexKitLite的使用
在ios項目中可以借用第三方框架RegexKitLite來簡化對正則表達式的使用,使用方法如下
1.去RegexKitLite下載類庫,解壓出來會有一個例子包及2個文件,將那兩個文件添加到工程中,並導入到項目中。 下載地址:
http://www.cocoachina.com/bbs/job.php?action-download-pid-135286-tid-18111-aid-11143.html - Lv
2.工程中添加libicucore.dylib frameworks。
下面就是使用介紹(可拷貝到Xcode中觀看會很方便)
- (void)howToUseRegexKitLite
{
NSString *searchString = @"我正在#話題#吃飯@zhangsan 你@lisi 吃了沒?";
NSString *regexString = @"@\\w+";
// 返回所有匹配成功的結果,並存放到一個數組里
NSArray *array = [searchString componentsMatchedByRegex:regexString];
NSLog(@"array:%@",array); // 輸出結果: ("@zhangsan","@lisi")
// 透過傳入一個Regex進行字符串的比對,並且會將第一組比對出來的結果以NSArray回傳群組
NSArray *array1 = [searchString captureComponentsMatchedByRegex:regexString];
NSLog(@"array1:%@",array1); // 輸出結果: ("@zhangsan")
// 同上者,一樣會回傳Regex所比對出來的字符串群組,但會回傳全部的配對組合
NSArray *array2 = [searchString arrayOfCaptureComponentsMatchedByRegex:regexString];
NSLog(@"array2:%@",array2); // 輸出結果: (("@zhangsan"),("@lisi"))
// 判斷字符串是否與Regex配對
BOOL isMatched = [@"@zhangsan" isMatchedByRegex:regexString];
if (isMatched) {
NSLog(@"配對成功");
}
// 取得配對出來的第一個完整字串
NSString *matchedString1 = [searchString stringByMatching:regexString];
NSLog(@"matchedString1:%@",matchedString1); // 輸出結果: @zhangsan
// 將字符串中與Regex配對的結果進行替換
NSString *replaceString = @"wangwu";
NSString *matchedString2 = [searchString stringByReplacingOccurrencesOfRegex:regexString withString:replaceString];
NSLog(@"matchedString2:%@",matchedString2); // 輸出結果: 我正在#話題#吃飯wangwu 你wangwu 吃了沒?
// 如果是NSMutableString,則可以直接替換,並返回替換的次數
NSMutableString *mutSearchString = [NSMutableString stringWithString:@"我正在#話題#吃放@zhangsan 你@lisi 吃了沒?"];
NSInteger mutMatchedString2 = [mutSearchString replaceOccurrencesOfRegex:regexString withString:replaceString];
NSLog(@"mutMatchedString2:%ld",mutMatchedString2); // 輸出結果: 2
// 返回一個拆分后的字符串數組
NSArray *array3 = [searchString componentsSeparatedByRegex:regexString];
NSLog(@"array3:%@",array3); // 輸出結果: ("我正在#話題#吃飯"," 你"," 吃了沒?")
}
#pragma mark RegexKitLite的使用總結
/*
RegexKitLite提供的方法都是透過NSString來操作,常用的方法:
1. - (NSArray *)RKL_METHOD_PREPEND(componentsMatchedByRegex):(NSString *)regex
返回所有匹配成功的結果,並存放到一個數組里
2. - (NSArray *)captureComponentsMatchedByRegex:(NSString *)regex;
這個方法是透過傳入一個Regex進行字串的比對,並且會將第一組比對出來的結果以NSArray回傳群組。
3. - (NSArray *)arrayOfCaptureComponentsMatchedByRegex:(NSString *)regex;
這個方法如同上者,一樣會回傳Regex所比對出來的字串群組,但會回傳全部的配對組合。
4. - (BOOL)isMatchedByRegex:(NSString *)regex;
判斷字串是否與Regex配對,在進行資料驗證的時候很實用。
5. - (NSString *)stringByMatching:(NSString *)regex;
這方法則是會回傳配對出來的第一個完整字串。
6. - (NSString *)stringByReplacingOccurrencesOfRegex:(NSString *)regex withString:(NSString *)replacement;
將字串中與Regex配對的結果進行替換。
7. - (NSInteger)replaceOccurrencesOfRegex:(NSString *)regex withString:(NSString *)replacement
如果是NSMutableString,則可以直接替換,並返回替換的次數
8. - (NSArray *)componentsSeparatedByRegex:(NSString *)regex
用於拆分,返回一個拆分后的字符串數組
*/
二.正則表達式的使用
- (void)howToUseRegex
{
#pragma mark 1.正則表達式規則
/*-------------------------------1.1普通字符-------------------------------*/
// 字母、數字、漢字、下划線、非特殊定義的標點符號,都是"普通字符"。表達式中的普通字符,在匹配一個字符串的時候,匹配與之相同的一個字符。
NSString *searchString1_1 = @"abcde";
NSString *regexString1_1 = @"c";
NSString *matchedString1_1 = [searchString1_1 stringByMatching:regexString1_1];
NSLog(@"matchedString1_1:%@",matchedString1_1); // 輸出結果: c
/*-------------------------------1.2簡單的轉義字符-------------------------------*/
// 一些不便書寫的字符,在前面加 "\",如:\n,\t,\\ 等
NSString *searchString1_2 = @"abc$de";
// 記住在字符串中“\”需要用“\\”表示
NSString *regexString1_2 = @"\\$d";
NSString *matchedString1_2 = [searchString1_2 stringByMatching:regexString1_2];
NSLog(@"matchedString1_2:%@",matchedString1_2); // 輸出結果: $d
/*------------------------1.3能夠與 '多種字符' 匹配的表達式-------------------------*/
/*
. : 匹配除換行符以外的任意字符
\w : 匹配字母或數字或下划線或漢字
\s : 匹配任意的空白符
\d : 匹配數字
\b : 匹配單詞的開始或結束
*/
NSString *searchString1_3 = @"abc123";
// 正則表達式有一條規則:最先開始的匹配擁有最高的優先權
NSString *regexString1_3 = @"\\d\\d";
NSString *matchedString1_3 = [searchString1_3 stringByMatching:regexString1_3];
NSLog(@"matchedString1_3:%@",matchedString1_3); // 輸出結果: 12
/*---------------------1.4自定義能夠匹配 '多種字符' 的表達式-------------------------*/
// 使用方括號 [ ] 包含一系列字符,能夠匹配其中任意一個字符。用 [^ ] 包含一系列字符,則能夠匹配其中字符之外的任意一個字符。同樣的道理,雖然可以匹配其中任意一個,但是只能是一個,不是多個。[]本身就隱含了“或”的關系,在[]中使用“|”表示“或”的關系是不對的,這樣做只是多了一個普通字符“|”,用來匹配“|”字符本身,()也是同樣道理。 如:
/*
[ab5@] : 匹配 "a" 或 "b" 或 "5" 或 "@"
[^abc] : 匹配 "a","b","c" 之外的任意一個字符
[f-k] : 匹配 "f"~"k" 之間的任意一個字母
[^A-F0-3] : 匹配 "A"~"F","0"~"3" 之外的任意一個字符
*/
NSString *searchString1_4 = @"abc123";
NSString *regexString1_4 = @"[bcd][bcd]";
NSString *matchedString1_4 = [searchString1_4 stringByMatching:regexString1_4];
NSLog(@"matchedString1_4:%@",matchedString1_4); // 輸出結果: bc
/*---------------------1.5修飾匹配次數的特殊符號------------------------------*/
// 使用表達式再加上修飾匹配次數的特殊符號,那么不用重復書寫表達式就可以重復匹配
/*
{n} : 表達式重復n次
{m,n} : 表達式至少重復m次,最多重復n次
{m,} : 表達式至少重復m次
? : 匹配表達式0次或者1次,相當於 {0,1}
+ : 表達式至少出現1次,相當於 {1,}
* : 表達式不出現或出現任意次,相當於 {0,}
*/
NSString *searchString1_5 = @"It costs $12.5";
NSString *regexString1_5 = @"\\d+\\.?\\d";
NSString *matchedString1_5 = [searchString1_5 stringByMatching:regexString1_5];
NSLog(@"matchedString1_5:%@",matchedString1_5); // 輸出結果: 12.5
/*---------------------1.6其他一些代表抽象意義的特殊符號--------------------------*/
// 一些符號在表達式中代表抽象的特殊意義
/*
^ : 與字符串開始的地方匹配,不匹配任何字符
$ : 與字符串結束的地方匹配,不匹配任何字符
\b : 匹配一個單詞邊界,也就是單詞和空格之間的位置,不匹配任何字符
*/
// 進一步說明:"\b" 與 "^" 和 "$" 類似,本身不匹配任何字符,但是它要求它在匹配結果中所處位置的左右兩邊,其中一邊是 "\w" 范圍,另一邊是 非"\w" 的范圍
NSString *searchString1_6 = @"@@@abc";
NSString *regexString1_6 = @".\\b.";
NSString *matchedString1_6 = [searchString1_6 stringByMatching:regexString1_6];
NSLog(@"matchedString1_6:%@",matchedString1_6); // 輸出結果: @a
#pragma mark 2.正則表達式中的一些高級規則
/*---------------------2.1匹配次數中的貪婪與非貪婪--------------------------*/
// 1)在使用修飾匹配次數的特殊符號"{m,n}", "{m,}", "?", "*", "+"可以使同一個表達式能夠匹配不同的次數,這種重復匹配不定次數的表達式在匹配過程中,總是盡可能多的匹配。如:
NSString *searchString2_1_1 = @"dxxxdxxxd";
NSString *regexString2_1_1 = @"(d)(\\w+)(d)";
NSString *matchedString2_1_1 = [searchString2_1_1 stringByMatching:regexString2_1_1];
NSLog(@"matchedString2_1_1:%@",matchedString2_1_1); // 輸出結果: dxxxdxxxd
// 2)在修飾匹配次數的特殊符號后再加上一個 "?" 號,則可以使匹配次數不定的表達式盡可能少的匹配,這種匹配原則叫作 "非貪婪" 模式,也叫作 "勉強" 模式
NSString *regexString2_1_2 = @"(d)(\\w+?)(d)";
NSString *matchedString2_1_2 = [searchString2_1_1 stringByMatching:regexString2_1_2];
NSLog(@"matchedString2_1_2:%@",matchedString2_1_2); // 輸出結果: dxxxd
/*---------------------2.2反向引用--------------------------------------*/
// 使用小括號指定一個子表達式后,匹配這個子表達式的文本(也就是此分組捕獲的內容)可以在表達式或其它程序中作進一步的處理。默認情況下,每個分組會自動擁有一個組號,規則是:從左向右,以分組的左括號為標志,第一個出現的分組的組號為1,第二個為2,以此類推
NSString *searchString2_2 = @"go go";
NSString *regexString2_2 = @"\\b(\\w+)\\b\\s+\\1\\b";
NSString *matchedString2_2 = [searchString2_2 stringByMatching:regexString2_2];
NSLog(@"matchedString2_2:%@",matchedString2_2); // 輸出結果: go go
/*----------------2.3零寬斷言-------------------------------------------*/
// 零寬斷言用於查找在某些內容(但並不包括這些內容)之前或之后的東西,也就是說它們像\b,^,$那樣用於指定一個位置,這個位置應該滿足一定的條件(即斷言),因此它們也被稱為零寬斷言
/*
1)捕獲
(exp) : 匹配exp,並捕獲文本到自動命名的組里
(?<name>exp) : 匹配exp,並捕獲文本到名稱為name的組里,也可以寫成(?'name'exp)
(?:exp) : 匹配exp,不捕獲匹配的文本,也不給此分組分配組號零寬斷言,可節約性能,提高效率
2)零寬斷言
(?=exp) : 匹配exp前面的位置
(?<=exp) : 匹配exp后面的位置
(?!exp) : 匹配后面跟的不是exp的位置
(?<!exp) : 匹配前面不是exp的位置注釋(?#comment)這種類型的分組不對正則表達式的處理產生任何影響,用於提供注釋讓人閱讀
*/
NSString *searchString2_3 = @"I'm singing while you're dancing.";
NSString *regexString2_3 = @"\\b\\w+(?=ing\\b)";
NSArray *matchedString2_3 = [searchString2_3 componentsMatchedByRegex:regexString2_3];
NSLog(@"matchedString2_3:%@",matchedString2_3); // 輸出結果: (sing,danc)
// 3.其他通用規則
/*----------------3.1------------------------------------------*/
// 表達式中,可以使用 "\xXX" 和 "\uXXXX" 表示一個字符("X" 表示一個十六進制數)
/*
\xXX : 編號在 0 ~ 255 范圍的字符,比如:空格可以使用 "\x20" 表示
\uXXXX : 任何字符可以使用 "\u" 再加上其編號的4位十六進制數表示,比如:"\u4E2D"
*/
/*----------------3.2------------------------------------------*/
// 在表達式 "\s","\d","\w","\b" 表示特殊意義的同時,對應的大寫字母表示相反的意義
/*
\S : 匹配所有非空白字符("\s" 可匹配各個空白字符)
\D : 匹配所有的非數字字符
\W : 匹配所有的字母、數字、下划線以外的字符
\B : 匹配非單詞邊界,即左右兩邊都是 "\w" 范圍或者左右兩邊都不是 "\w" 范圍時的字符縫隙
*/
/*----------------3.3------------------------------------------*/
// 在表達式中有特殊意義,需要添加 "\" 才能匹配該字符本身的字符匯總
/*
^ : 匹配輸入字符串的開始位置。要匹配 "^" 字符本身,請使用 "\^"
$ : 匹配輸入字符串的結尾位置。要匹配 "$" 字符本身,請使用 "\$"
( ) : 標記一個子表達式的開始和結束位置。要匹配小括號,請使用 "\(" 和 "\)"
[ ] : 用來自定義能夠匹配 '多種字符' 的表達式。要匹配中括號,請使用 "\[" 和 "\]"
{ } : 修飾匹配次數的符號。要匹配大括號,請使用 "\{" 和 "\}"
. : 匹配除了換行符(\n)以外的任意一個字符。要匹配小數點本身,請使用 "\."
? : 修飾匹配次數為 0 次或 1 次。要匹配 "?" 字符本身,請使用 "\?"
+ : 修飾匹配次數為至少 1 次。要匹配 "+" 字符本身,請使用 "\+"
* : 修飾匹配次數為 0 次或任意次。要匹配 "*" 字符本身,請使用 "\*"
| : 左右兩邊表達式之間 "或" 關系。匹配 "|" 本身,請使用 "\|"
" : 用在不帶@的字符串中時,用\"來進行轉義,用在帶@的字符串中時,用""來進行轉義
注意:大部分在正則中有特殊意義、在匹配其本身時需轉義的字符,在[]內是不需要轉義的。必須轉義的只有“\”、“[”和“]”,而“^”出現在[]開始位置,“-”前后構成范圍區間時,需要轉義,出現在其它位置不需要轉義,如:[\^ .$^{\[(|)*+?\\-]
*/
}
附錄 一 : 常用正則表達式
一、校驗數字的表達式
1 數字:^[0-9]*$
2 n位的數字:^\d{n}$
3 至少n位的數字:^\d{n,}$
4 m-n位的數字:^\d{m,n}$
5 零和非零開頭的數字:^(0|[1-9][0-9]*)$
6 非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
7 帶1-2位小數的正數或負數:^(\-)?\d+(\.\d{1,2})?$
8 正數、負數、和小數:^(\-|\+)?\d+(\.\d+)?$
9 有兩位小數的正實數:^[0-9]+(.[0-9]{2})?$
10 有1~3位小數的正實數:^[0-9]+(.[0-9]{1,3})?$
11 非零的正整數:^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
12 非零的負整數:^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
13 非負整數:^\d+$ 或 ^[1-9]\d*|0$
14 非正整數:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
15 非負浮點數:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
16 非正浮點數:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
17 正浮點數:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
18 負浮點數:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19 浮點數:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
二、校驗字符的表達式
1 漢字:^[\u4e00-\u9fa5]{0,}$
2 英文和數字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
3 長度為3-20的所有字符:^.{3,20}$
4 由26個英文字母組成的字符串:^[A-Za-z]+$
5 由26個大寫英文字母組成的字符串:^[A-Z]+$
6 由26個小寫英文字母組成的字符串:^[a-z]+$
7 由數字和26個英文字母組成的字符串:^[A-Za-z0-9]+$
8 由數字、26個英文字母或者下划線組成的字符串:^\w+$ 或 ^\w{3,20}$
9 中文、英文、數字包括下划線:^[\u4E00-\u9FA5A-Za-z0-9_]+$
10 中文、英文、數字但不包括下划線等符號:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
11 可以輸入含有^%&',;=?$\"等字符:[^%&',;=?$\x22]+
12 禁止輸入含有~的字符:[^~\x22]+
三、特殊需求表達式
1 Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
2 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
3 InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
4 手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
5 電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
6 國內電話號碼(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
7 身份證號(15位、18位數字):^\d{15}|\d{18}$
8 短身份證號碼(數字、字母x結尾):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
9 帳號是否合法(字母開頭,允許5-16字節,允許字母數字下划線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10 密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下划線):^[a-zA-Z]\w{5,17}$
11 強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字符,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
12 日期格式:^\d{4}-\d{1,2}-\d{1,2}
13 一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$
14 一個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
15 錢的輸入格式:
16 1.有四種錢的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$
17 2.這表示任意一個不以0開頭的數字,但是,這也意味着一個字符"0"不通過,所以我們采用下面的形式:^(0|[1-9][0-9]*)$
18 3.一個0或者一個不以0開頭的數字.我們還可以允許開頭有一個負號:^(0|-?[1-9][0-9]*)$
19 4.這表示一個0或者一個可能為負的開頭不為0的數字.讓用戶以0開頭好了.把負號的也去掉,因為錢總不能是負的吧.下面我們要加的是說明可能的小數部分:^[0-9]+(.[0-9]+)?$
20 5.必須說明的是,小數點后面至少應該有1位數,所以"10."是不通過的,但是 "10" 和 "10.2" 是通過的:^[0-9]+(.[0-9]{2})?$
21 6.這樣我們規定小數點后面必須有兩位,如果你認為太苛刻了,可以這樣:^[0-9]+(.[0-9]{1,2})?$
22 7.這樣就允許用戶只寫一位小數.下面我們該考慮數字中的逗號了,我們可以這樣:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
23 8.1到3個數字,后面跟着任意個 逗號+3個數字,逗號成為可選,而不是必須:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
24 備注:這就是最終結果了,別忘了"+"可以用"*"替代如果你覺得空字符串也可以接受的話(奇怪,為什么?)最后,別忘了在用函數時去掉去掉那個反斜杠,一般的錯誤都在這里
25 xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
26 中文字符的正則表達式:[\u4e00-\u9fa5]
27 雙字節字符:[^\x00-\xff] (包括漢字在內,可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1))
28 空白行的正則表達式:\n\s*\r (可以用來刪除空白行)
29 HTML標記的正則表達式:<(\S*?)[^>]*>.*?</\1>|<.*? /> (網上流傳的版本太糟糕,上面這個也僅僅能部分,對於復雜的嵌套標記依舊無能為力)
30 首尾空白字符的正則表達式:^\s*|\s*$或(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式)
31 騰訊QQ號:[1-9][0-9]{4,} (騰訊QQ號從10000開始)
32 中國郵政編碼:[1-9]\d{5}(?!\d) (中國郵政編碼為6位數字)
33 IP地址:\d+\.\d+\.\d+\.\d+ (提取IP地址時有用)
附錄二 : 參考資料
正則表達式檢測工具:http://www.regexlab.com/zh/workshop.htm
http://tool.oschina.net/regex
參考文檔: http://www.regexlab.com/zh/regref.htm
http://deerchao.net/tutorials/regex/regex.htm
http://lxcnn.cnblogs.com/