在UltraEdit的查找和替換中使用正則表達式 (轉)


很多朋友都用過或者正在用UltraEdit,這個編輯器陪伴我也好幾年了,從很多地方影響着我寫代碼的快捷鍵習慣,Ultraedit提供了非常豐富的編輯功能,其中非常重要的查找和替換功能一定大家都用過,Ultraedit提供的查找替換功能非常方便和強大,可以在單獨文件里面查找替換,也可以在多個文件、多個目錄里面進行查找替換。而我們在使用這些查找替換功能的時候,一

LiveJournal Tags: UltraEdit,正則表達式
般都是針對某個字符串進行,前兩天我要對一個目錄下(包含子目錄)所有的html文件中某一段代碼進行查找替換,一下子不知道怎么操作了,由於長期寫程序用到正則表達式,於是猜想具備如此強大功能的Ultraedit一定也有這樣類似的匹配功能,於是點擊Help一看,果然不出所料,Ultraedit支持基本的正則表達式匹配查找和替換功能,這能滿足我們幾乎全部的需要了。

下面是對UltraEdit的Help中針對查找替換使用正則表達式部分的整理,最后還有我前兩天用到的一個多行代碼查找替換的例子。

Ultraedit在使用正則表達式進行查找替換時有兩個可使用的語法集合。一個是 UltraEdit 的更早的版本被使用的原來的 UltraEdit 句法。另一個是”Unix”類型的正則表達式,這個集合在ultraedit的默認配置中是沒有啟用的,需要在配置中找到search項,啟用Unix類型的正則表達式。

語法集合一:

符號  功能
%     匹配行的開始 - 顯示搜索字符串必須在行的開始,但是在所選擇的結果字符串中不包括任何行終止字符。
$     匹配行尾 - 顯示搜索字符串必須在行尾,但是在所選擇的結果字符串中不包括任何行終止字符。
?     除了換行符以外匹配任何單個的字符
*     除了換行符匹配任何數量的字符和數字
+     前一字符匹配一個或多個,但至少要出現一個
++    前一字符匹配零個或多個,但至少要出現一個
^b    匹配一個分頁
^p    匹配一個換行符(CR/LF)(段)(DOS文件)
^r    匹配一個換行符(CR 僅僅)(段)(MAC 文件)
^n    匹配一個換行符 ( LF 僅僅 )( 段 )( UNIX 文件 )
^t    匹配一個標簽字符TAB
[]    匹配任何單個的字符,或在方括號中的范圍
^{A^}^{ B^} 匹配表達式A或 B
^     重載其后的正規表達式字符
^(^)  括或標注為用於替換命令的表達式。


一個正則表達式最多可以有9個標注表達式, 按正規表達式的需要而定。
相應的替換表達式是 ^x , 替換范圍x是1-9。例如:
If ^(h*o^) ^(f*s^) matches “hello folks”,
^2 ^1 would replace it with “folks hello”.

(hello folks 將被替換成 folks hello。)

注: ^ 是實際字符 ^不是Ctl + 鍵值。

例如:
m?n 匹配 “man”,”men”,”min” 但不匹配 “moon”.
t*t 匹配 “test”,”tonight” 和 “tea time” (the “tea t” portion) 但不匹配 “tea
time” (newline between “tea ” and “time”).
Te+st 匹配 “test”,”teest”,” teeeest “等等。但是不匹配 “tst”。
[aeiou] 匹配每個小寫元音。
[,.?] 匹配一文字的 “,”,”.”或 “?”。
[0-9, a-z] 匹配任何數位,或小寫字母。
[~0-9] 除了數字以外匹配任何字符 (~ 意味着”不”)

你按如下方式可以查找一個表達式A或 B :

“^{John^}^{Tom^}”

這將在找John或Tom的出現。應該在 2 個表達式之間沒有任何東西。

你可以在同一搜索中按如下方式組合A or B and C or D:

“^{John^}^{Tom^}^{Smith^}^{Jones^}”

這將在John or Tom 后面找 Smith or Jones。

語法二:”Unix”句法類型的正則表達式

符號        功能
\          標記下一個字符作為一個特殊的字符。
"n"         匹配字符"n"。"n" 一個換行符或換行符字符。
^           匹配/定位行的開始。
$           匹配/定位行的尾。
*           匹配前面的字符零次或多次。例
+           匹配前面的字符一次或多次。例
.           匹配除了一個換行符字符匹配任何單個的字符。
(expression)標注用於替換命令的表達式。一個正則表達式根據需要,最多可以有9個標注表達式。相應的代替表達式是 x , x的范圍是 1-9 。
例如:
If (h.*o) (f.*s) matches "hello folks",
2 1 would replace it with "folks hello".
(hello folks 將被替換成 folks hello。)

[xyz]       一個字符集。匹配在方括號之間的任何字符。
[^xyz]      一個否定的字符集。不匹配在方括號之間的任何字符。
\d          匹配一個數字字符。等價於[0-9]。
\D          匹配一個非數字字符。等價於[^0-9]。
\f          匹配一個換頁字符。
\n          匹配一個換行字符。
\r          匹配一個回車符字符。
\s          匹配任何空白的空格, 標簽, 換頁, 包括空格等等,但不匹配換行符。
\S          匹配任何非空白的字符,但不匹配換行符。
\t          匹配一個標簽TAB字符。
\v          匹配一個垂直的標簽字符。
\w          匹配任何詞語字符包括下划線。
\W          匹配任何非詞語字符字符。
注: ^ 是實際字符 ^不是Ctl + 鍵值。

例如:
m.n 匹配 “man”,”men”,”min” 但不匹配 “moon”.
t+t 匹配 “test”,”tonight” 和 “tea time” (the “tea t” portion) 但不匹配 “tea
time” (newline between “tea ” and “time”).
Te*st 匹配 “test”,”teest”,” teeeest “等等。但是不匹配 “tst”。
[aeiou] 匹配每個小寫元音。
[,.?] 匹配一文字的 “,”,”.”或 “?”。
[0-9,a-z] 匹配任何數位,或小寫字母。
[^0-9] 除了數字以外匹配任何字符 (~ 意味着”不”)

你按如下方式可以查找一個表達式A或 B :

“(John)|(Tom)”

這將在找John或Tom的出現。應該在 2 個表達式之間沒有任何東西。

你可以在同一搜索中按如下方式組合A or B and C or D:

“(John|Tom) (Smith|Jones)”

這將在John or Tom 后面找 Smith or Jones。

另外:

p 匹配 CR/LF ( 作為 rn 的一樣 ) 作為DOS行結束符匹配

如果查找/替換功能中正則表達式沒有選用,則替換字段中下列字符也是有效的:

符號 功能

^^ 匹配一個 “^” 字符
^s 替換為被選擇 ( 加亮 ) 活躍的文件窗口的文章。
^c 替換為剪貼板的內容
^b 匹配一個頁裂縫
^p 匹配一個換行符 ( CR/LF )( 段 )( DOS 文件)
^r 匹配一個換行符 ( CR 僅僅 )( 段 )( MAC 文件)
^n 匹配一個換行符 ( LF 僅僅 )( 段 )( UNIX 文件)
^t 匹配一個標簽TAB字符

下面是我要實現的一段代碼查詢替換的舉例
我想把一個.lrc文件中的漢字去掉:

[ti:046]
[ar:Book I]
[al:english900]
[la:zh]
[by:]
[00:00.00][4] Identifying objects.辨別物品
[00:00.00]
[00:00.01]What are these? 這些是什么?
[00:01.93]Those are books. 那些是書。
[00:03.87]Where are the books? 那些書在哪兒?
[00:06.13]There they are. 在那兒。
[00:08.68]These are my pencils. 這些是我的鉛筆。
[00:12.00]Where are your pens? 你的那些鋼筆在哪兒?
[00:14.85]They're over there. 在那里。
[00:17.48]Are these your pens? 這些是你的鋼筆嗎?
[00:20.04]Yes,they are. 是我的。
[00:22.63]Those are mine. 那些是我的。
[00:25.39]These are your books,aren't they? 這些書是你的,對不對?
[00:28.35]No,they aren't. 不,不是。
[00:31.07]They're not mine. 不是我的。
[00:33.39]These are mine,and those are yours. 這些是我的,而那些是你的。
[00:35.57]Those aren't your pens,are they? 那些鋼筆不是你的,對吧?
[00:36.38]

點"搜索"->"替換",選中"正則表達式"

查找:^([/./?]^) ?++$

替換為:^1

點“全部替換”,完成。

大家可以在今后的編碼中嘗試一下Ultraedit的正則表達式查找替換功能,非常簡單快捷


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM