很多朋友都用過或者正在用UltraEdit,這個編輯器陪伴我也好幾年了,從很多地方影響着我寫代碼的快捷鍵習慣,Ultraedit提供了非常豐富的編輯功能,其中非常重要的查找和替換功能一定大家都用過,Ultraedit提供的查找替換功能非常方便和強大,可以在單獨文件里面查找替換,也可以在多個文件、多個目錄里面進行查找替換。而我們在使用這些查找替換功能的時候,一
般都是針對某個字符串進行,前兩天我要對一個目錄下(包含子目錄)所有的html文件中某一段代碼進行查找替換,一下子不知道怎么操作了,由於長期寫程序用到正則表達式,於是猜想具備如此強大功能的Ultraedit一定也有這樣類似的匹配功能,於是點擊Help一看,果然不出所料,Ultraedit支持基本的正則表達式匹配查找和替換功能,這能滿足我們幾乎全部的需要了。下面是對UltraEdit的Help中針對查找替換使用正則表達式部分的整理,最后還有我前兩天用到的一個多行代碼查找替換的例子。
Ultraedit在使用正則表達式進行查找替換時有兩個可使用的語法集合。一個是 UltraEdit 的更早的版本被使用的原來的 UltraEdit 句法。另一個是”Unix”類型的正則表達式,這個集合在ultraedit的默認配置中是沒有啟用的,需要在配置中找到search項,啟用Unix類型的正則表達式。
語法集合一:
符號 功能
% 匹配行的開始 - 顯示搜索字符串必須在行的開始,但是在所選擇的結果字符串中不包括任何行終止字符。
$ 匹配行尾 - 顯示搜索字符串必須在行尾,但是在所選擇的結果字符串中不包括任何行終止字符。
? 除了換行符以外匹配任何單個的字符
* 除了換行符匹配任何數量的字符和數字
+ 前一字符匹配一個或多個,但至少要出現一個
++ 前一字符匹配零個或多個,但至少要出現一個
^b 匹配一個分頁
^p 匹配一個換行符(CR/LF)(段)(DOS文件)
^r 匹配一個換行符(CR 僅僅)(段)(MAC 文件)
^n 匹配一個換行符 ( LF 僅僅 )( 段 )( UNIX 文件 )
^t 匹配一個標簽字符TAB
[] 匹配任何單個的字符,或在方括號中的范圍
^{A^}^{ B^} 匹配表達式A或 B
^ 重載其后的正規表達式字符
^(^) 括或標注為用於替換命令的表達式。
一個正則表達式最多可以有9個標注表達式, 按正規表達式的需要而定。
相應的替換表達式是 ^x , 替換范圍x是1-9。例如:
If ^(h*o^) ^(f*s^) matches “hello folks”,
^2 ^1 would replace it with “folks hello”.
(hello folks 將被替換成 folks hello。)
注: ^ 是實際字符 ^不是Ctl + 鍵值。
例如:
m?n 匹配 “man”,”men”,”min” 但不匹配 “moon”.
t*t 匹配 “test”,”tonight” 和 “tea time” (the “tea t” portion) 但不匹配 “tea
time” (newline between “tea ” and “time”).
Te+st 匹配 “test”,”teest”,” teeeest “等等。但是不匹配 “tst”。
[aeiou] 匹配每個小寫元音。
[,.?] 匹配一文字的 “,”,”.”或 “?”。
[0-9, a-z] 匹配任何數位,或小寫字母。
[~0-9] 除了數字以外匹配任何字符 (~ 意味着”不”)
你按如下方式可以查找一個表達式A或 B :
“^{John^}^{Tom^}”
這將在找John或Tom的出現。應該在 2 個表達式之間沒有任何東西。
你可以在同一搜索中按如下方式組合A or B and C or D:
“^{John^}^{Tom^}^{Smith^}^{Jones^}”
這將在John or Tom 后面找 Smith or Jones。
語法二:”Unix”句法類型的正則表達式
符號 功能
\ 標記下一個字符作為一個特殊的字符。
"n" 匹配字符"n"。"n" 一個換行符或換行符字符。
^ 匹配/定位行的開始。
$ 匹配/定位行的尾。
* 匹配前面的字符零次或多次。例
+ 匹配前面的字符一次或多次。例
. 匹配除了一個換行符字符匹配任何單個的字符。
(expression)標注用於替換命令的表達式。一個正則表達式根據需要,最多可以有9個標注表達式。相應的代替表達式是 x , x的范圍是 1-9 。
例如:
If (h.*o) (f.*s) matches "hello folks",
2 1 would replace it with "folks hello".
(hello folks 將被替換成 folks hello。)
[xyz] 一個字符集。匹配在方括號之間的任何字符。
[^xyz] 一個否定的字符集。不匹配在方括號之間的任何字符。
\d 匹配一個數字字符。等價於[0-9]。
\D 匹配一個非數字字符。等價於[^0-9]。
\f 匹配一個換頁字符。
\n 匹配一個換行字符。
\r 匹配一個回車符字符。
\s 匹配任何空白的空格, 標簽, 換頁, 包括空格等等,但不匹配換行符。
\S 匹配任何非空白的字符,但不匹配換行符。
\t 匹配一個標簽TAB字符。
\v 匹配一個垂直的標簽字符。
\w 匹配任何詞語字符包括下划線。
\W 匹配任何非詞語字符字符。
注: ^ 是實際字符 ^不是Ctl + 鍵值。
例如:
m.n 匹配 “man”,”men”,”min” 但不匹配 “moon”.
t+t 匹配 “test”,”tonight” 和 “tea time” (the “tea t” portion) 但不匹配 “tea
time” (newline between “tea ” and “time”).
Te*st 匹配 “test”,”teest”,” teeeest “等等。但是不匹配 “tst”。
[aeiou] 匹配每個小寫元音。
[,.?] 匹配一文字的 “,”,”.”或 “?”。
[0-9,a-z] 匹配任何數位,或小寫字母。
[^0-9] 除了數字以外匹配任何字符 (~ 意味着”不”)
你按如下方式可以查找一個表達式A或 B :
“(John)|(Tom)”
這將在找John或Tom的出現。應該在 2 個表達式之間沒有任何東西。
你可以在同一搜索中按如下方式組合A or B and C or D:
“(John|Tom) (Smith|Jones)”
這將在John or Tom 后面找 Smith or Jones。
另外:
p 匹配 CR/LF ( 作為 rn 的一樣 ) 作為DOS行結束符匹配
如果查找/替換功能中正則表達式沒有選用,則替換字段中下列字符也是有效的:
符號 功能
^^ 匹配一個 “^” 字符
^s 替換為被選擇 ( 加亮 ) 活躍的文件窗口的文章。
^c 替換為剪貼板的內容
^b 匹配一個頁裂縫
^p 匹配一個換行符 ( CR/LF )( 段 )( DOS 文件)
^r 匹配一個換行符 ( CR 僅僅 )( 段 )( MAC 文件)
^n 匹配一個換行符 ( LF 僅僅 )( 段 )( UNIX 文件)
^t 匹配一個標簽TAB字符
下面是我要實現的一段代碼查詢替換的舉例
我想把一個.lrc文件中的漢字去掉:
[ti:046]
[ar:Book I]
[al:english900]
[la:zh]
[by:]
[00:00.00][4] Identifying objects.辨別物品
[00:00.00]
[00:00.01]What are these? 這些是什么?
[00:01.93]Those are books. 那些是書。
[00:03.87]Where are the books? 那些書在哪兒?
[00:06.13]There they are. 在那兒。
[00:08.68]These are my pencils. 這些是我的鉛筆。
[00:12.00]Where are your pens? 你的那些鋼筆在哪兒?
[00:14.85]They're over there. 在那里。
[00:17.48]Are these your pens? 這些是你的鋼筆嗎?
[00:20.04]Yes,they are. 是我的。
[00:22.63]Those are mine. 那些是我的。
[00:25.39]These are your books,aren't they? 這些書是你的,對不對?
[00:28.35]No,they aren't. 不,不是。
[00:31.07]They're not mine. 不是我的。
[00:33.39]These are mine,and those are yours. 這些是我的,而那些是你的。
[00:35.57]Those aren't your pens,are they? 那些鋼筆不是你的,對吧?
[00:36.38]
點"搜索"->"替換",選中"正則表達式"
查找:^([/./?]^) ?++$
替換為:^1
點“全部替換”,完成。
大家可以在今后的編碼中嘗試一下Ultraedit的正則表達式查找替換功能,非常簡單快捷