在UltraEdit的查找和替換中使用正則表達式 (轉)

本文轉載自查看原文 2016-06-07 18:01 13598

很多朋友都用過或者正在用UltraEdit，這個編輯器陪伴我也好幾年了，從很多地方影響着我寫代碼的快捷鍵習慣，Ultraedit提供了非常豐富的編輯功能，其中非常重要的查找和替換功能一定大家都用過，Ultraedit提供的查找替換功能非常方便和強大，可以在單獨文件里面查找替換，也可以在多個文件、多個目錄里面進行查找替換。而我們在使用這些查找替換功能的時候，一

LiveJournal Tags: UltraEdit,正則表達式

般都是針對某個字符串進行，前兩天我要對一個目錄下（包含子目錄）所有的html文件中某一段代碼進行查找替換，一下子不知道怎么操作了，由於長期寫程序用到正則表達式，於是猜想具備如此強大功能的Ultraedit一定也有這樣類似的匹配功能，於是點擊Help一看，果然不出所料，Ultraedit支持基本的正則表達式匹配查找和替換功能，這能滿足我們幾乎全部的需要了。

下面是對UltraEdit的Help中針對查找替換使用正則表達式部分的整理，最后還有我前兩天用到的一個多行代碼查找替換的例子。

Ultraedit在使用正則表達式進行查找替換時有兩個可使用的語法集合。一個是 UltraEdit 的更早的版本被使用的原來的 UltraEdit 句法。另一個是”Unix”類型的正則表達式，這個集合在ultraedit的默認配置中是沒有啟用的，需要在配置中找到search項，啟用Unix類型的正則表達式。

語法集合一：

符號功能
%     匹配行的開始 - 顯示搜索字符串必須在行的開始，但是在所選擇的結果字符串中不包括任何行終止字符。
$     匹配行尾 - 顯示搜索字符串必須在行尾，但是在所選擇的結果字符串中不包括任何行終止字符。
?     除了換行符以外匹配任何單個的字符
*     除了換行符匹配任何數量的字符和數字
+     前一字符匹配一個或多個，但至少要出現一個
++    前一字符匹配零個或多個，但至少要出現一個
^b    匹配一個分頁
^p    匹配一個換行符(CR/LF)(段)(DOS文件)
^r    匹配一個換行符(CR 僅僅)(段)(MAC 文件)
^n    匹配一個換行符 ( LF 僅僅 )( 段 )( UNIX 文件 )
^t    匹配一個標簽字符TAB
[]    匹配任何單個的字符，或在方括號中的范圍
^{A^}^{ B^} 匹配表達式A或 B
^     重載其后的正規表達式字符
^(^) 括或標注為用於替換命令的表達式。

一個正則表達式最多可以有9個標注表達式, 按正規表達式的需要而定。
相應的替換表達式是 ^x , 替換范圍x是1-9。例如：
If ^(h*o^) ^(f*s^) matches “hello folks”,
^2 ^1 would replace it with “folks hello”.

（hello folks 將被替換成 folks hello。）

注： ^ 是實際字符 ^不是Ctl + 鍵值。

例如：
m?n 匹配 “man”,”men”,”min” 但不匹配 “moon”.
t*t 匹配 “test”,”tonight” 和 “tea time” (the “tea t” portion) 但不匹配 “tea
time” (newline between “tea ” and “time”).
Te+st 匹配 “test”,”teest”,” teeeest “等等。但是不匹配 “tst”。
[aeiou] 匹配每個小寫元音。
[,.?] 匹配一文字的 “,”，”.”或 “?”。
[0-9, a-z] 匹配任何數位，或小寫字母。
[~0-9] 除了數字以外匹配任何字符 (~ 意味着”不”)

你按如下方式可以查找一個表達式A或 B ：

“^{John^}^{Tom^}”

這將在找John或Tom的出現。應該在 2 個表達式之間沒有任何東西。

你可以在同一搜索中按如下方式組合A or B and C or D：

“^{John^}^{Tom^}^{Smith^}^{Jones^}”

這將在John or Tom 后面找 Smith or Jones。

語法二：”Unix”句法類型的正則表達式

符號        功能
\          標記下一個字符作為一個特殊的字符。
"n"         匹配字符"n"。"n" 一個換行符或換行符字符。
^           匹配/定位行的開始。
$           匹配/定位行的尾。
*           匹配前面的字符零次或多次。例
+           匹配前面的字符一次或多次。例
.           匹配除了一個換行符字符匹配任何單個的字符。
(expression)標注用於替換命令的表達式。一個正則表達式根據需要，最多可以有9個標注表達式。相應的代替表達式是 x , x的范圍是 1-9 。
例如：
If (h.*o) (f.*s) matches "hello folks",
2 1 would replace it with "folks hello".
（hello folks 將被替換成 folks hello。）

[xyz]       一個字符集。匹配在方括號之間的任何字符。
[^xyz]      一個否定的字符集。不匹配在方括號之間的任何字符。
\d          匹配一個數字字符。等價於[0-9]。
\D          匹配一個非數字字符。等價於[^0-9]。
\f          匹配一個換頁字符。
\n          匹配一個換行字符。
\r          匹配一個回車符字符。
\s          匹配任何空白的空格, 標簽, 換頁, 包括空格等等，但不匹配換行符。
\S          匹配任何非空白的字符，但不匹配換行符。
\t          匹配一個標簽TAB字符。
\v          匹配一個垂直的標簽字符。
\w          匹配任何詞語字符包括下划線。
\W          匹配任何非詞語字符字符。
注： ^ 是實際字符 ^不是Ctl + 鍵值。

例如：
m.n 匹配 “man”,”men”,”min” 但不匹配 “moon”.
t+t 匹配 “test”,”tonight” 和 “tea time” (the “tea t” portion) 但不匹配 “tea
time” (newline between “tea ” and “time”).
Te*st 匹配 “test”,”teest”,” teeeest “等等。但是不匹配 “tst”。
[aeiou] 匹配每個小寫元音。
[,.?] 匹配一文字的 “,”，”.”或 “?”。
[0-9,a-z] 匹配任何數位，或小寫字母。
[^0-9] 除了數字以外匹配任何字符 (~ 意味着”不”)

你按如下方式可以查找一個表達式A或 B ：

“(John)|(Tom)”

這將在找John或Tom的出現。應該在 2 個表達式之間沒有任何東西。

你可以在同一搜索中按如下方式組合A or B and C or D：

“(John|Tom) (Smith|Jones)”

這將在John or Tom 后面找 Smith or Jones。

另外：

p 匹配 CR/LF ( 作為 rn 的一樣 ) 作為DOS行結束符匹配

如果查找/替換功能中正則表達式沒有選用，則替換字段中下列字符也是有效的：

符號功能

^^ 匹配一個 “^” 字符
^s 替換為被選擇 ( 加亮 ) 活躍的文件窗口的文章。
^c 替換為剪貼板的內容
^b 匹配一個頁裂縫
^p 匹配一個換行符 ( CR/LF )( 段 )( DOS 文件)
^r 匹配一個換行符 ( CR 僅僅 )( 段 )( MAC 文件)
^n 匹配一個換行符 ( LF 僅僅 )( 段 )( UNIX 文件)
^t 匹配一個標簽TAB字符

下面是我要實現的一段代碼查詢替換的舉例
我想把一個.lrc文件中的漢字去掉:

[ti:046]
[ar:Book I]
[al:english900]
[la:zh]
[by:]
[00:00.00][4] Identifying objects.辨別物品
[00:00.00]
[00:00.01]What are these? 這些是什么？
[00:01.93]Those are books. 那些是書。
[00:03.87]Where are the books? 那些書在哪兒？
[00:06.13]There they are. 在那兒。
[00:08.68]These are my pencils. 這些是我的鉛筆。
[00:12.00]Where are your pens? 你的那些鋼筆在哪兒？
[00:14.85]They're over there. 在那里。
[00:17.48]Are these your pens? 這些是你的鋼筆嗎？
[00:20.04]Yes,they are. 是我的。
[00:22.63]Those are mine. 那些是我的。
[00:25.39]These are your books,aren't they? 這些書是你的，對不對？
[00:28.35]No,they aren't. 不，不是。
[00:31.07]They're not mine. 不是我的。
[00:33.39]These are mine,and those are yours. 這些是我的，而那些是你的。
[00:35.57]Those aren't your pens,are they? 那些鋼筆不是你的，對吧？
[00:36.38]

點"搜索"->"替換",選中"正則表達式"

查找：^([/./?]^) ?++$

替換為：^1

點“全部替換”，完成。

大家可以在今后的編碼中嘗試一下Ultraedit的正則表達式查找替換功能，非常簡單快捷

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。