一、正則表達式的介紹:
正則表達式是用於描述字符排列和匹配模式的一種語法規則。它主要用於字符串的模式分割、匹配、查找及替換操作。
1. 用途:匹配、查找、替換、分割
2. php提供了兩套正則表達式函數庫
*1. Perl 兼容正則表達式函數(推薦使用)
2. POSIX 擴展正則表達式函數
二、 語法:
1. 表達式的格式: "/表達式/[修正符]"
解釋:其中"/"表示正則表達式的定界符,但是也可以是其他符號:如”#“,”!“
注意:定界符不可以是字母、數字和斜線\。
像“#”、“|”、“!”等都可以的
如:/.../ #...# |....|
其中修正符是可選的,表示對表達式做額外的修飾。
三、正則表達式的組成部分:
1. 原子是組成正則表達式的基本單位,在分析正則表達式時,應作為一個整體。
原子包括以下內容:
> 單個字符、數字,如a-z,A-Z,0-9。
> 模式單元,如(ABC)可以理解為由多個原子組成的大的原子。
> 原子表,如 [ABC]。
> 重新使用的模式單元,如:\\1
> 普通轉義字符,如:\d, \D, \w
> 轉義元字符,如:\*,\.
> 元字符
*2. 元字符(具有特殊意義字符):
[] 表示單個字符的原子表
例如:[aoeiu] 表示任意一個元音字母
[0-9] 表示任意一位數字
[a-z][0-9]表示小寫字和一位數字構成的兩位字符
[a-zA-Z0-9] 表示任意一位大小字母或數字
[^] 表示除中括號內原子之外的任何字符 是[]的取反
例如:[^0-9] 表示任意一位非數字字符
[^a-z] 表示任意一位非小寫字母
{m} 表示對前面原子的數量控制,表示是m次
例如:[0-9]{4} 表示4為數字
[1][3-8][0-9]{9} 手機號碼
{m,} 表示對前面原子的數量控制,表示是至少m次
例如: [0-9]{2,} 表示兩位及以上的數字
{m,n}表示對前面原子的數量控制,表示是m到n次
例如: [a-z]{6,8} 表示6到8位的小寫字母
* 表示對前面原子的數量控制,表示是任意次,等價於{0,}
+ 表示對前面原子的數量控制,表示至少1次,等價於{1,}
? 表示對前面原子的數量控制,表示0次或1次(可有可無) 等價於{0,1}
例如:正整數:[1-9][0-9]*
整數:[\-]?[0-9]+
email:
() 表示一個整體原子,【還有一個子存儲單元的作用】。
也可以使用?:來拒絕子存儲。 (?:.*?)
例如:(red) 字串red
(rea|blue) 字串red或blue
(abc){2} 表示兩個abc
| 表示或的意思
(rea|blue) 字串red或blue
^ 用在正則單元塊的開頭處,表示必須以指定的開頭
$ 用在正則單元塊的結尾處,表示必須以指定的結尾
. 表示任意一個除換行符之外的字符
常用組合: .*? 表示最小匹配所有字符(拒絕貪婪匹配)
php正則表達式函數:
preg_grep -- 返回與模式匹配的數組單元
* preg_match_all -- 進行全局正則表達式匹配 , 返回共計匹配的個數。
和下面的一樣,不同的是匹配到最后(全局匹配)
* preg_match -- 進行正則表達式匹配,只匹配一次,返回1,否則0,
格式:preg_match("正則表達式","被匹配的字串",存放結果的變量名,PREG_OFFSET_CAPTURE,起始偏移量)
其中:PREG_OFFSET_CAPTURE表示獲取匹配索引位置
起始偏移量:從指定位置開始匹配
preg_quote -- 轉義正則表達式字符
preg_split -- 用正則表達式分割字符串
preg_replace -- 執行正則表達式的搜索和替換