用正則表達式獲取文件名和路徑

本文轉載自查看原文 2013-08-22 18:10 15558

一個文件中包括文件的路徑和文件名，用正則表達式來分割路徑和文件名

$WholePath = "/usr/lib/file.txt";
$leadPath = "";
$fileName = "";
if ($WholePath =~ m!^(.*)/([^/]*)$!) {

	#能夠匹配 $1 和 $2都合法
	
	$leadPath = $1;
	$fileName = $2
} else {

	#無法匹配， 文件名中不含'/'
	$leadPath = ".";
	$fileName = $WholePath;
}

print "leadPath: ".$leadPath."\n";
print "fileName: ".$fileName."\n"

效果為：

leadPath: /usr/lib
fileName: file.txt

使用語言：perl

這里用了兩個括號來匹配路徑和文件名，perl是使用的傳統的NFA（非確定有限自動機），講一下原理;

NFA使用是深度搜索回溯的方法，所以在寫正則表達式的時候，需要考慮的正則表達式的效率問題，

如前面的例子:

!^(.*)/([^/]*)$! ——這里使用嘆號“!”是因為里面有斜杠"/"

在NFA中如： “ .* ” 這樣的式子，有用點號"."可以匹配任意字符，所以兩個字符的組合第一次直接把字符串給匹配完了

接着后面出現了一個斜杠，但此時已經匹配到末尾了，所以匹配會回溯，直到第一個斜杠，然后這里匹配成功，接着

是所有的非斜杠字符，那這當然是文件名了，然后匹配結束。

這里需要注意幾點：

一，應該使用脫字符號"^"因為匹配重第一個字符開始，匹配到最后，如果變量$WholePath中沒有斜杠，

匹配會一直回溯到第一個字符，此時匹配不成功，然而，因為沒有脫字符，匹配會嘗試重第二個字符

開始匹配，並回溯到第二個字符，然后是第三個....直到最后一個字符，這只是一個小的字符串，如果

是一個很長的文本，那么就會很費時了，所以，寫正則的時候，應考慮到脫字符，這樣加上后，當第一次

回溯到第一個字符時，就匹配失敗了，這樣時間就快了很多。

二，使用“.*”時，匹配是直接匹配的一行的結束，然后才回溯匹配的，一般來說深度搜索的效率比較低，所以

應該盡可能的減少多余的回溯

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 C#正則表達式匹配磁盤路徑和文件名 java 使用正則表達式對文件名非法字符處理正則表達式匹配(獲取) 所有表名獲取圖片路徑正則表達式使用正則表達式獲取多種指定擴展名的文件正則表達式校驗文件路徑 js通過正則表達式，獲取文件類型獲取文件的名稱的正則表達式 QT 正則表達式(進階篇)IP，端口號，文件名，非空格字符的匹配，已驗證 C# 正則表達式判斷是否是有效的文件、文件夾路徑