正則表達式——行起始/結束位置


  單詞邊界匹配的是某個位置而不是文本,在正則表達式中,這類匹配位置的元素叫做錨點(anchor),它用來“定位”到某個位置。常用的錨點還有^$,它們分別匹配字符串的開始位置和結束位置,所以可以用來判斷“整個字符串能否由表達式匹配”。

平台 行終止符
UNIX/Linux \n
Windows \r\n
Mac OS \n

 

// php

// ^ 和 $ 特點:進行正則表達式替換時並不會被替換。
// 也就是說,在起始/結束位置進行替換,只會在起始/結束位置添加一些字符,位置本身仍然存在。

$plainText = "line1\nline2\nline3";
$result = preg_replace('/$/m', '</p>', preg_replace('/^/m', '<p>', $plainText));

// ^ 和 $ 常用功能是刪去多余的空白,包括行首尾的空白和空行。
$withSpaces = " begin\n between\t\n\nend ";
$spaceRegex = '/(^\s+|\s+$)/m';
$result = preg_replace($spaceRegex, '', $withSpaces);

// 不但第三行被刪除,第二行和第四行也合並成一行,中間的\t\n\n全部刪除了,第二行末尾沒有了換行符;
// 而真正的目的其實只是將\t\n\n替換為\n。
// 仔細看看正則表達式(^\s+|\s+$)可以知道,在\s+$中,\s可以匹配\t和\n,
// 所以\s+$可以匹配開始的\t\n,同樣^\s+可以匹配結尾的\n,所以\t\n\n經過兩步被徹底刪除

begin
betweenend

^和$的總結

模式

行為 .NET Java Javascript PHP Python Ruby

^匹配字符串起始位置  √  √  √  √  √  √
^匹配字符串內部行起始位置            √
$匹配字符串結束位置  √  √  √  √  √  √
$匹配字符串末尾行終止符之前  √  √    √  √  √
$匹配字符串內部行結束位置            √
 支持多行模式  √  √  √  √  √  

式    

 ^匹配字符串起始位置  √  √  √  √  √  無此模式
 ^匹配字符串內部行起始位置  √  √  √  √  √  無此模式
$匹配字符串結束位置   √  √   √  √  √  無此模式
 $匹配字符串內部行結束位置  √  √  √  √  √  無此模式
     \A 等於默認模式的^  √  √    √  只能匹配字符串的起始位置  ×
 \Z 等於默認模式的$  √  √    √  只能匹配字符串的結束位置  ×
 \z 匹配字符串的結束位置  √  √    √  無  × 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM