用正則表達式獲取文件名和路徑


一個文件中包括文件的路徑和文件名,用正則表達式來分割路徑和文件名

 

$WholePath = "/usr/lib/file.txt";
$leadPath = "";
$fileName = "";
if ($WholePath =~ m!^(.*)/([^/]*)$!) {

	#能夠匹配 $1 和 $2都合法
	
	$leadPath = $1;
	$fileName = $2
} else {

	#無法匹配, 文件名中不含'/'
	$leadPath = ".";
	$fileName = $WholePath;
}

print "leadPath: ".$leadPath."\n";
print "fileName: ".$fileName."\n"


效果為:

 

 

leadPath: /usr/lib
fileName: file.txt

使用語言:perl

 

這里用了兩個括號來匹配路徑和文件名,perl是使用的傳統的NFA(非確定有限自動機),講一下原理;

NFA使用是深度搜索回溯的方法,所以在寫正則表達式的時候,需要考慮的正則表達式的效率問題,

如前面的例子:

!^(.*)/([^/]*)$!         ——這里使用嘆號“!”是因為里面有斜杠"/"

在NFA中如: “ .* ” 這樣的式子,有用點號"."可以匹配任意字符,所以兩個字符的組合第一次直接把字符串給匹配完了

接着后面出現了一個斜杠,但此時已經匹配到末尾了, 所以匹配會回溯,直到第一個斜杠,然后這里匹配成功,接着

是所有的非斜杠字符,那這當然是文件名了,然后匹配結束。


這里需要注意幾點:

       一,應該使用脫字符號"^"因為匹配重第一個字符開始,匹配到最后,如果變量$WholePath中沒有斜杠,

             匹配會一直回溯到第一個字符,此時匹配不成功, 然而,因為沒有脫字符,匹配會嘗試重第二個字符

             開始匹配,並回溯到第二個字符,然后是第三個....直到最后一個字符,這只是一個小的字符串,如果

             是一個很長的文本,那么就會很費時了,所以,寫正則的時候,應考慮到脫字符,這樣加上后,當第一次

             回溯到第一個字符時,就匹配失敗了,這樣時間就快了很多。

        二,使用“.*”時,匹配是直接匹配的一行的結束,然后才回溯匹配的,一般來說深度搜索的效率比較低,所以

              應該盡可能的減少多余的回溯

       





 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM