php 正則匹配省市區


 

匹配指定前后內容中的值

如匹配/xxx-abc中的abc

preg_match('/\/xxx-([^<]*)/i', $route, $matches);
echo $matches[1];

 

去除字符串中換行

// 1)使用轉義字符函數
<?php
$str = str_replace(array("/r/n", "/r", "/n"), '', $str);
?>
// 2)使用正則表達式替換
<?php
$str = preg_replace('//s*/', '', $str);
?>
// 3)使用PHP系統常量【推薦】
$str = str_replace(PHP_EOL, '', $str);

 

省市區正則匹配

preg_match('/(.*?(省|自治區|北京市|天津市))+(.*?(市|自治州|地區|區划|縣))+(.*?(區|縣|鎮|鄉|街道))/', $address, $matches);

  

獲得省市區數組

        $address = ‘廣東省深圳市南山區’;
        preg_match('/(.*?(省|自治區|北京市|天津市))/', $address, $matches);
        if (count($matches) > 1) {
            $province = $matches[count($matches) - 2];
            $address = str_replace($province, '', $address);
        }
        preg_match('/(.*?(市|自治州|地區|區划|縣))/', $address, $matches);
        if (count($matches) > 1) {
            $city = $matches[count($matches) - 2];
            $address = str_replace($city, '', $address);
        }
        preg_match('/(.*?(區|縣|鎮|鄉|街道))/', $address, $matches);
        if (count($matches) > 1) {
            $area = $matches[count($matches) - 2];
            $address = str_replace($area, '', $address);
        }

        return [
            'province' => isset($province) ? $province : '',
            'city' => isset($city) ? $city : '',
            'area' => isset($area) ? $area : '',
        ];            

  

感覺應該還有更好的方法,歡迎評論留言

 

其他:

匹配6位數字

$str="8e0971cbe0f558baab5cc24ea4d85f580|175219";
preg_match_all("/\d{6}/",$str,$result);
print_r($result);exit();

 

以下部分轉載:https://www.cnblogs.com/hellohell/p/5718319.html

正則表達式的基本知識匯總

行定位符(^與$)

行定位符是用來描述字符串的邊界。“$”表示行結尾“^”表示行開始如"^de",表示以de開頭的字符串 "de$",表示以de結尾的字符串。

單詞定界符

我們在查找的一個單詞的時候,如an是否在一個字符串”gril and body”中存在,很明顯如果匹配的話,an肯定是可以匹配字符串“gril and body”匹配到,怎樣才能讓其匹配單詞,而不是單詞的一部分呢?這時候,我們可以是喲個單詞定界符\b。 
\ban\b 去匹配”gril and body”的話,就會提示匹配不到。 
當然還有一個大寫的\B,它的意思,和\b正好相反,它匹配的字符串不能使一個完整的單詞,而是其他單詞或字符串中的一部分。如\Ban\B。

選擇字符(|) ,表示或

選擇字符表示或的意思。如Aa|aA,表示Aa或者是aA的意思。注意使用”[]”與”|”的區別,在於”[]”只能匹配單個字符,而”|”可以匹配任意長度的字符串。在使用”[]”的時候,往往配合連接字符”-“一起使用,如[a-d],代表a或b或c或d。

排除字符,排除操作

正則表達式提供了”^”來表示排除不符合的字符,^一般放在[]中。如[^1-5],該字符不是1~5之間的數字。

限定符(?*+{n,m})

限定符主要是用來限定每個字符串出現的次數。

限定字符 含義
零次或一次
* 零次或多次
+ 一次或多次
{n} n次
{n,} 至少n次
{n,m} n到m次

如(D+)表示一個或多個D

點號操作符

匹配任意一個字符(不包含換行符)

表達式中的反斜杠(\)

表達式中的反斜杠有多重意義,如轉義、指定預定義的字符集、定義斷言、顯示不打印的字符。

轉義字符

轉義字符主要是將一些特殊字符轉為普通字符。而這些常用特殊字符有”.”,”?”、”\”等。

指定預定義的字符集

字符 含義
\d 任意一個十進制數字[0-9]
\D 任意一個非十進制數字
\s 任意一個空白字符(空格、換行符、換頁符、回車符、字表符)
\S 任意一個非空白字符
\w 任意一個單詞字符
\W 任意個非單詞字符

###顯示不可打印的字符

字符 含義
\a 報警
\b 退格
\f 換頁
\n 換行
\r 回車
\t 字表符

括號字符()

在正則表達式中小括號的作用主要有:

  • 改變限定符如(|、* 、^)的作用范圍 
    如(my|your)baby,如果沒有”()”,|將匹配的是要么是my,要么是yourbaby,有了小括號,匹配的就是mybaby或yourbaby。
  • 進行分組,便於反向引用

反向引用

反向引用,就是依靠子表達式的”記憶”功能,匹配連續出現的字串或是字符。如(dqs)(pps)\1\2,表示匹配字符串dqsppsdqspps。在下面php應用中,我將詳細展開學習反向引用。

模式修飾符

模式修飾符的作用是設定模式,也就是正則表達式如何解釋。php中主要模式如下表:

修飾符 說明
i 忽略大小寫
m 多文本模式
s 單行文本模式
x 忽略空白字符

正則表達式在php中應用

php中字符串匹配

所謂的字符串匹配,言外之意就是判斷一個字符串中,是否包含或是等於另一個字符串。如果不使用正則,我們可以使用php中提供了很多方法進行這樣的判斷。

不使用正則匹配

  • strstr函數 
    string strstr ( string haystack,mixedneedle [, bool $before_needle = false ]) 
    • 注1:haystack,needle是被查找的字符串。該函數區分大小寫。
    • 注2:返回值是從needle開始到最后。
    • 注3:關於$needle,如果不是字符串,被當作整形來作為字符的序號來使用。
    • 注4:before_needle若為true,則返回前東西。
  • stristr函數與strstr函數相同,只是它不區分大小寫
  • strpo函數 
    int strpos ( string haystack,mixedneedle [, int $offset = 0 ] ) 
    注1:可選的 offset 參數可以用來指定從 haystack 中的哪一個字符開始查找。返回的數字位置是相對於 haystack 的起始位置而言的。
  • stripos -查找字符串首次出現的位置(不區分大小定)
  • strrpos -計算指定字符串在目標字符串中最后一次出現的位置
  • strripos -計算指定字符串在目標字符串中最后一次出現的位置(不區分大小寫

使用正則進行匹配

在php中,提供了preg_math()和preg_match_all函數進行正則匹配。關於這兩個函數原型如下:


int preg_match|preg_match_all ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] )

搜索subject與pattern給定的正則表達式的一個匹配. 
pattern:要搜索的模式,字符串類型。 
subject :輸入字符串。 
matches:如果提供了參數matches,它將被填充為搜索結果。 matches[0],matches[1]將包含第一個捕獲子組匹配到的文本,以此類推。 
flags:flags可以被設置為以下標記值:PREG_OFFSET_CAPTURE 如果傳遞了這個標記,對於每一個出現的匹配返回時會附加字符串偏移量(相對於目標字符串的)。 注意:這會改變填充到matches參數的數組,使其每個元素成為一個由 第0個元素是匹配到的字符串,第1個元素是該匹配字符串 在目標字符串subject中的偏移量。 
offset:通常,搜索從目標字符串的開始位置開始。可選參數 offset 用於 指定從目標字符串的某個未知開始搜索(單位是字節)。 
返回值:preg_match()返回 pattern 的匹配次數。 它的值將是0次(不匹配)或1次,因為 preg_match()在第一次匹配后 將會停止搜索。 preg_match_all()不同於此,它會一直搜索subject直到到達結尾。 如果發生錯誤 preg_match()返回 FALSE。

實例

  • 實例1 
    判斷字符串”http://blog.csdn.net/hsd2012“中是否包含csdn? 
    解法一(不適用正則): 
    如果不適用正則,我們使用strstr或者strpos中任意一個都可以,在此,我將使用strstr函數,代碼如下:
$str='http://blog.csdn.net/hsd2012'; function checkStr1($str,$str2) { return strstr1($str,$str2)?true:false; } echo checkStr($str,'csdn');

解法二:使用正則 
因為我們只需要判斷是否存在即可,所以選擇preg_match。

$str='http://blog.csdn.net/hsd2012'; $pattern='/csdn/'; function checkStr2($str,$str2) { return preg_match($str2,$str)?true:false; } echo checkStr2($str,$pattern);
  • 實例2(考察單詞定界符) 
    判斷字符串”I am a good boy”中是否包含單詞go 
    首先判斷是單詞,而不是字符串,因此比較的時候,需要比較是否包含’ go ‘,即在字符串go前后有一個空格。 
    解析:如果使用非正則比較,只需要調用上面的checkStr1()函數即可,注意,第二個參數前后要加一個空格,即’ go ‘。如果使用正則, 
    我們可以考慮使用單詞定界符\b,那么$pattern=’/\bgo\b/’;然后調用checkStr2函數即可.
  • 例3(考察反向引用
    判斷字符串”I am a good boy”中是否包含3個相同的字母 
    解析:此時,如果我們不使用正則,將會很難判斷,因為字母太多了,我們不可能去將所有字母分別與該字符串比較,那樣工作量也比較大。這時候涉及到了正在的反向引用。在php正則表達式中,通過\n,來表示第n次匹配到的結果。如\5代表第五次匹配到的結果。那么本題的$pattern='/(\w).*\1.*\1/'; 
    主要注意的是,在使用反向匹配的時候都需要使用(),反向匹配時,匹配()里面出現的字符或字符串。

php中字符串替換

不使用正則

php中當替換字符串的時候,如果不適用正則,我們通常使用substr、mb_substr、str_replace、substr_replace關於這幾個函數區別如下表。

函數符 功能 描述
str_replace(find,replace,string,count) 使用一個字符串替換字符串中的另一些字符。 find 必需。規定要查找的值。replace 必需。規定替換 find 中的值的值。string 必需。規定被搜索的字符串。count 可選。一個變量,對替換數進行計數。
substr_replace(string,replacement,start,length) 把字符串的一部分替換為另一個字符串。適合用於替換自定位置的字符串。 string 必需。規定要檢查的字符串。replacement 必需。規定要插入的字符串。start 必需。規定在字符串的何處開始替換。

使用正則

如果使用正則替換,php中提供了preg_replace _callback和preg_replace 函數,preg_replace 原型如下: 
mixed preg_replace ( mixed pattern,mixedreplacement , mixed subject[,intlimit = -1 [, int &count]])串subject中,查找pattern,使用replacement 去替換,如果有limitlimitpregreplacecallbackpregreplacepregreplaceback使調callbackreplacement.1hello,hello;:str=’hello,中國’; 
str=strreplace(hello,,str) 
或是使用str=substrreplace(str,’你好’,0,5) 
使用正則 
pattern=/hello/;str=preg_replace (pattern,,str); 
- 例2 
去除字符串”gawwenngeeojjgegop”中連續相同的字母

$str='gawwenngeeojjgegop'; $pattern='/(.)\1/'; $str=preg_replace($pattern,'',$str);

解析:當然這樣可能會遇到,當第一次去除了重復了字符串后,又出來重復的字符串。如字符串味’gewwenngeeojjgegop’,針對這中問題,當然,這樣的話,通過判斷,繼續替換下去。

  • 例3 
    將字符串中”age13gegep3iorji65k65k”;中出現的連續兩個數字改為第二個數字,如字符串中13被改為3
$str='age13gegep3iorji65k65k'; $pattern='/(\d)(\d)/'; $str=preg_replace($pattern,'$2', $str);

解析:$n在正則表達式外使用反向引用。n代表第幾次匹配到的結果。

php中字符串分割

不適用正則

php提供了explode函數去分割字符串,與其對應的是implode。關於explode原型如下: 
array explode ( string delimiter,stringstring [, int $limit ] ) 
delimiter:邊界上的分隔字符。 
string:輸入的字符串。 
limit:如果設置了 limit 參數並且是正數,則返回的數組包含最多 limit 個元素,而最后那個元素將包含 string 的剩余部分。如果 limit 參數是負數,則返回除了最后的 -limit 個元素外的所有元素。如果 limit 是 0,則會被當做 1。

使用正則

關於通過正則表達式進行字符串分割,php提供了split、preg_split 函數。preg_split() 函數,通常是比 split() 更快的替代方案。 
array preg_split ( string pattern,stringsubject [, int limit=1[,intflags = 0 ]] )

$str='http://blog.csdn.net/hsd2012/article/details/51152810'; $str=explode('/', $str);

解法二:

$str='http://blog.csdn.net/hsd2012/article/details/51152810'; $pattern='/\//'; /*因為/為特殊字符,需要轉移*/ $str=preg_split ($pattern, $str);

php中貪婪匹配與惰性匹配

  • 貪婪匹配:就是匹配盡可能多的字符。 
    比如,正則表達式中m.*n,它將匹配最長以m開始,n結尾的字符串。如果用它來搜索manmpndegenc的話,它將匹配到的字符串是manmpndegen而非man。可以這樣想,當匹配到m的時候,它將從后面往前匹配字符n。
  • 懶惰匹配:就是匹配盡可能少的字符。 
    有的時候,我們需要並不是去貪婪匹配,而是盡可能少的去匹配。這時候,就需要將其轉為惰性匹配。怎樣將一個貪婪匹配轉為惰性匹配呢?只需要在其后面添加一個”?”即可。如m.*?n將匹配manmpndegenc,匹配到的字符串是man。
函數符 描述
*? 零次或多次,但盡可能少的匹配
+? 一次或多次,但盡可能少的匹配
?? 0次或1次,但盡可能少的匹配
{n,}? 至少n次,但盡可能少的匹配
{n,m}? n到m次 ,但盡可能少的匹配

 

 

php中其他常用字符串操作函數

  • 字符串截取截取 
    string substr ( string string,intstart [, int length])stringmbsubstr(stringstr , int start[,intlength = NULL [, string $encoding = mb_internal_encoding() ]] )
  • 字符串中大小寫轉換 
    strtoupper 
    strtolower 
    ucfirst 
    ucwords
  • 字符串比較 
    -strcmp、strcasecmp、strnatcmp
  • 字符串過濾
  • 字符串翻轉 
    strrev($str);
  • 字符串隨機排序 
    string str_shuffle ( string $str )

補充

怎樣進行郵箱匹配,url匹配,手機匹配

使用preg_match函數進行匹配,以下內容從TP中復制而來。 
郵箱驗證 
pattern=/\w+([+.]\w+)@\w+([.]\w+)\.\w+([.]\w+)∗/’; 
url匹配 
pattern='/^http(s?):\/\/(?:[A-za-z0-9-]+\.)+[A-za-z]{2,4}(:\d+)?(?:[\/\?#][\/=\?%\-&~`@[\]\':+!\.#\w]*)?/’; 
手機驗證 
pattern=/1[3458]\d10/’;

php中正則的優缺點

php中正則在某些時候,能幫我們解決php函數很多困難的匹配或是替換。然后php中正則的效率,往往是我們需要考慮的,所以在某些時候,能不用正則還是盡量不去用它,除非,某些場合必須用到,或是我們能夠有效減少其回溯次數。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM