vi/vim正則表達式

本文轉載自查看原文 2016-08-14 17:23 2238 正則表達式

http://www.cnblogs.com/penseur/archive/2011/02/25/1964522.html

毋庸多言，在vim中正則表達式得到了十分廣泛的應用。最常用的 / 和 :s 命令中，正則表達式都是不可或缺的。下面對vim中的正則表達式的一些難點進行說明。

關於magic

vim中有個magic的設定。設定方法為：

:set magic " 設置magic :set nomagic " 取消magic :h magic " 查看幫助

vim畢竟是個編輯器，正則表達式中包含的大量元字符如果原封不動地引用（像perl 那樣），勢必會給不懂正則表達式的人造成麻煩，比如 /foo(1) 命令，大多數人都用它來查找foo(1)這個字符串，但如果按照正則表達式來解釋，被查找的對象就成了 foo1 了。

於是，vim就規定，正則表達式的元字符必須用反斜杠進行轉義才行，如上面的例子，如果確實要用正則表達式，就應當寫成 /foo$1$ 。但是，像 . * 這種極其常用的元字符，都加上反斜杠就太麻煩了。而且，眾口難調，有些人喜歡用正則表達式，有些人不喜歡用……

為了解決這個問題，vim設置了 magic 這個東西。簡單地說， magic就是設置哪些元字符要加反斜杠哪些不用加的。簡單來說：

magic (\m)：除了 $ . * ^ 之外其他元字符都要加反斜杠。

nomagic (\M)：除了 $ ^ 之外其他元字符都要加反斜杠。

這個設置也可以在正則表達式中通過 \m \M 開關臨時切換。 \m 后面的正則表達式會按照 magic 處理，\M 后面的正則表達式按照 nomagic 處理，而忽略實際的magic設置。

例如：

/\m.* # 查找任意字符串

/\M.* # 查找字符串 ".*"

另外還有更強大的 \v 和 \V。

\v （即 very magic 之意）：任何元字符都不用加反斜杠

\V （即 very nomagic 之意）：任何元字符都必須加反斜杠

例如：

/\v(a.c){3}$ # 查找行尾的abcaccadc

/\m(a.c){3}$ # 查找行尾的(abc){3}

/\M(a.c){3}$ # 查找行尾的(a.c){3}

/\V(a.c){3}$ # 查找任意位置的(a.c){3}$

正則表達式的()和[]的用法:

http://blog.csdn.net/hanjieson/article/details/8885206

http://www.cnblogs.com/snandy/p/3650309.html

1.(A\d){2}---->

(ABC)?---->0個或者1個ABC----->

(ABC)+---->1個以上ABC-------->

(ABC)*----->0個或者多個ABC--------->

--------------------------------------------------

2.(ABC|123)---->

**************************************

2.1gr(a|e)y---->匹配gray或者grey --->等價於gr[ae]y

2.2(Doctor|Dr\.?)--->匹配Doctor Dr Dr.----->?表示0個或者1個;

ps (Doctor|Dr.?)這個也可以匹配Doctor Dr Dr. 不同明白\在這里的意義..

------------------------------------------------------------------------

3.錯誤匹配的交替行為:使用交替行為時，有時會出現意想不到的錯誤

用(a|ab)匹配ab時,只能匹配a

用(ab|a)則可以匹配ab------------->

--------------------------------------------------------------------------

4.捕獲圓括號：正則表達式中，與位於圓括號之間的模式匹配的內容都會被捕獲

****************************************************

4.1當模式中有嵌套的圓括號時，變量的編號會按照圓開括號出現的位置一次進行

([A-Za-z](\d{2}))((-)\d{2})----->匹配A22-33時匹配情況如下:

group1:A22

group2:22

group3:-33

group4:-

-------------------------------------------------------------------------

5..NET和JavaScript中，表示匹配第一組的變量被指定為”\1”

ps +表示"一個以上" ?表示"0個或者1個" *表示"o個或者多個"

(boy)\1------>

ps:(boy)是一個"boy" \1是一個"boy" 所以只能匹配boyboy

(boy)(girl)\1\2----->

^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

http://www.cnblogs.com/snandy/p/3662423.html

接下來是[]的學習 (以c#的語法進行說明--->其他語法雖然不同但是正則的規則是相同的)

1.簡單字符組

----------------------------------------------------------------------------------

2.范圍字符組（Range class，與連字符 “-” 一起使用）

如果要匹配0-9可以寫成 [0123456789]，但有了范圍字符組更簡潔了，可以寫成 /[0-9]/

匹配小寫英文字母可以用字符組 [a-z]，匹配大寫英文字母用 [A-Z]。

這里最關鍵的是連字符 "-"，不要理解為減號。它的意義是“從什么到什么”，如[a-z]理解為從 “a” 到 “z”。

需要注意幾點

1. 連字符（-）只在字符組內（中括號）才是元字符。如

2. 甚至在字符組內部，它也不一定是元字符。如

此外，很多元字符在字符組內都變成了普通字符，如(^$?)等。

3. 范圍不能亂寫，比如只能 [0-9]，不能[9-0]. 范圍字符組實際是安裝字符對於的ASCII碼值來確定的，值小的在前面，值大的在后面。例如[0-9]的碼值為48~57，[a-z]的碼值為97~122，[A-Z]的碼值為65~90。

4.組合字符組 ->由多種字符組組合一起的字符組->需要注意的是，字符組內不要有空格，有人喜歡在f和1之間加個空格，以便閱讀起來舒服一些，但這是不允許的

------------------------------------------------------------------------------------------------------------------------------------------

3.排除型字符組（Negated character class，與脫字符 “^” 一起使用）--->即不匹配xxx

------------------------------------------------------------------------------------------------------------

4.字符組運算（方括號嵌套+運算符）

有些語言支持，比如&&+[] Java中就支持，但JavaScript不支持

^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

http://www.jb51.net/article/52594.htm

\s--->空格

\s{3}---->匹配3個空格

\s[1,3]---->匹配 1個空格 or 2個空格 or 3個空格

(0-9)---->匹配'0-9'

[0-9]{1,3} VS [0-9]{1,4} VS [0-9]{1,2} 這個到底怎么用啊....沒看明白語法

(a){1,3} VS (a){1,4} VS (a){1,2} 這個到底怎么用啊....沒看明白語法

--------------------------------------------------------------

1{n}重復n次

1{m,n}最小重復m次,最多重復n次---------------------------->

1{m,} 最小重復m次---------------------------->-->字符串0-9重復數字10次所以\d{9,}是可以把這個字符串匹配出來的.

感謝各位帖子的博主.

默認設置是 magic，vim也推薦大家都使用magic的設置，在有特殊需要時，直接通過 \v\m\M\V 即可。

本文下面使用的元字符都是 magic 模式下的。

量詞

vim的量詞與perl相比一點也不遜色。 vim的量詞和perl的量詞的對照表

vim	Perl	意義
*	*	0個或多個(匹配優先)
\+	+	1個或多個(匹配優先)
\? 或 \=	?	0個或1個(匹配優先)，\?不能在 ? 命令（逆向查找）中使用
\{n,m}	{n,m}	n個到m個(匹配優先)
\{n,}	{n,}	最少n個(匹配優先)
\{,m}	{,m}	最多m個(匹配優先)
\{n}	{n}	恰好n個
\{-n,m}	{n,m}?	n個到m個(忽略優先)
\{-}	*?	0個或多個(忽略優先)
\{-1,}	+?	1個或多個(忽略優先)
\{-,1}	??	0個或1個(忽略優先)

環視和固化分組

vim居然還支持環視和固化分組的功能，強大，贊一個關於環視的解釋請參考Yurii的《精通正則表達式》一書吧。

vim	Perl	意義
\@=	(?=	順序環視
\@!	(?!	順序否定環視
\@<=	(?<=	逆序環視
\@<!	(?<!	逆序否定環視
\@>	(?>	固化分組
\%(atom\)	(?:	非捕獲型括號

和perl稍有不同的是，vim中的環視和固化分組的模式的位置與perl不同。例如，查找緊跟在 foo 之后的 bar，perl將模式寫在環視的括號內，而vim將模式寫在環視的元字符之前。

# Perl的寫法 /(?<=foo)bar/

# vim的寫法 /$foo$\@<=barvim正則表達式寫道

元字符說明
. 匹配任意一個字符
[abc] 匹配方括號中的任意一個字符。可以使用-表示字符范圍，如[a-z0-9]匹配小寫字母和阿拉伯數字。[^abc] 在方括號內開頭使用^符號，表示匹配除方括號中字符之外的任意字符。
\d 匹配阿拉伯數字，等同於[0-9]。
\D 匹配阿拉伯數字之外的任意字符，等同於[^0-9]。
\x 匹配十六進制數字，等同於[0-9A-Fa-f]。
\X 匹配十六進制數字，等同於[^0-9A-Fa-f]。
\w 匹配單詞字母，等同於[0-9A-Za-z_]。
\W 匹配單詞字母之外的任意字符，等同於[^0-9A-Za-z_]。
\t 匹配<TAB>字符。
\s 匹配空白字符，等同於[ \t]。
\S 匹配非空白字符，等同於[^ \t]。
\a 所有的字母字符. 等同於[a-zA-Z]
\l 小寫字母 [a-z]
\L 非小寫字母 [^a-z]
\u 大寫字母 [A-Z]
\U 非大寫字母 [^A-Z]

表示數量的元字符
元字符說明
* 匹配0-任意個
\+ 匹配1-任意個 注意前面的\
\? 匹配0-1個 注意前面的\
\{n,m} 匹配n-m個 注意前面的\
\{n} 匹配n個          注意前面的\
\{n,} 匹配n-任意個 注意前面的\
\{,m} 匹配0-m個    注意前面的\
\_. 匹配包含換行在內的所有字符
\{-} 表示前一個字符可出現零次或多次，但在整個正則表達式可以匹配成功的前提下，匹配的字符數越少越好
\= 匹配一個可有可無的項
\_s 匹配空格或斷行
\_[]

元字符說明
\* 匹配 * 字符。
\. 匹配 . 字符。
\/ 匹配 / 字符。
\\ 匹配 \ 字符。
\[ 匹配 [ 字符。

表示位置的符號
元字符說明
$ 匹配行尾
^ 匹配行首
\< 匹配單詞詞首
\> 匹配單詞詞尾

替換變量
在正規表達式中使用 $ 和 $ 符號括起正規表達式，即可在后面使用\1、\2等變量來訪問 $ 和 $ 中的內容。

懶惰模式
\{-n,m} 與\{n,m}一樣，盡可能少次數地重復
\{-} 匹配它前面的項一次或0次, 盡可能地少
\| "或"操作符
\& 並列

函數式
:s/替換字符串/\=函數式
在函數式中可以使用 submatch(1)、submatch(2) 等來引用 \1、\2 等的內容，而submatch(0)可以引用匹配的整個內容。

與Perl正則表達式的區別 ?
元字符的區別
Vim語法 Perl語法含義
\+           +      1-任意個
\?            ?       0-1個
\{n,m}   {n,m} n-m個
$和$ (和)     分組

例如：
1, 去掉所有的行尾空格：“:%s/\s\+$//”。“%”表示在整個文件范圍內進行替換，“\s”表示空白字符（空格和制表符），“\+”對前面的字符匹配一次或多次（越多越好），“___FCKpd___0rdquo;匹配行尾（使用“\___FCKpd___0rdquo;表示單純的 “___FCKpd___0rdquo;字符）；被替換的內容為空；由於一行最多只需替換一次，不需要特殊標志。這個還是比較簡單的。(/<Space><Tab>)
2,去掉所有的空白行：“:%s/$\s*\n$\+/\r/”。這回多了“ $”、“$”、“\n”、“\r”和 “*”。“*”代表對前面的字符（此處為“\s”）匹配零次或多次（越多越好；使用“\*”表示單純的“*”字符），“\n”代表換行符，“\r”代表回車符，“$”和“$”對表達式進行分組，使其被視作一個不可分割的整體。因此，這個表達式的完整意義是，把連續的換行符（包含換行符前面可能有的連續空白字符）替換成為一個單個的換行符。唯一很特殊的地方是，在模式中使用的是“\n”，而被替換的內容中卻不能使用“\n”，而只能使用“\r”。原因是歷史造成的，詳情如果有興趣的話可以查看“:help NL-used-for-Nul”。
3,去掉所有的“//”注釋：“:%s!\ s*//.*!!”。首先可以注意到，這兒分隔符改用了“!”，原因是在模式或字符串部分使用了“/”字符，不換用其他分隔符的話就得在每次使用“/”字符本身時寫成“\/”，上面的命令得寫成“:%s/\s*\/\/.*//”，可讀性較低。命令本身倒是相當簡單，用過正則表達式的人估計都知道“.”匹配表示除換行符之外的任何字符吧。
4,去掉所有的“/* */”注釋：“:%s!\s*/\*\_.\{-}\*/\s*! !g”。這個略有點復雜了，用到了幾個不太常用的 Vim 正則表達式特性。“\_.”匹配包含換行在內的所有字符；“\{-}”表示前一個字符可出現零次或多次，但在整個正則表達式可以匹配成功的前提下，匹配的字符數越少越好；標志“g”表示一行里可以匹配和替換多次。替換的結果是個空格的目的是保證像“int/* space not necessary around comments */main()”這樣的表達式在替換之后仍然是合法的。

:g/^\s*$/d 刪除只有空白的行

:s/$\w\+$\s\+$\w\+$/\2\t\1 將 data1 data2 修改為 data2 data1

:%s/$\w\+$, $\w\+$/\2 \1/ 將 Doe, John 修改為 John Doe

:%s/\<id\>/\=line(".") 將各行的 id 字符串替換為行號

:%s/$^\<\w\+\>$/\=(line(".")-10) .".". submatch(1) 將每行開頭的單詞替換為(行號-10).單詞的格式,如第11行的word替換成1. word

排序 :/OB/+1,$!sort

http://www.cnblogs.com/PegasusWang/p/3153300.html

:s/\<four\>/4/g                        " 將所有的four替換成4，但是fourteen中的four不替換

/\(a\+\)[^a]\+\1                                          " 查找開頭和結尾處a的個數相同的字符串，" 如 aabbbaa，aaacccaaa，但是不匹配 abbbaa

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 vi正則表達式 6.VIM和正則表達式 vim正則表達式 vim正則表達式（轉） vim 中的正則表達式 [Vim] 搜索模式（正則表達式） vim正則表達式的替換變量 Vim查找替換及正則表達式的使用 vim刪除#開頭的行和正則表達式筆記在 vim 中使用正則表達式