bash通配符 shell正則表達式

本文轉載自查看原文 2017-10-29 21:48 1609 5 Shell編程

在linux中

通配符是系統命令使用，一般用來匹配文件名或者什么的用在系統命令中。
通配符是系統級別的，通配符多用在文件名上，比如查找find，ls，cp，rm

正則表達式是操作字符串，以行尾單位來匹配字符串使用的。

正則表達式需要相關工具的支持例如： egrep, awk, vi, perl。
在文本過濾工具里，都是用正則表達式，比如像awk，sed等，是針對文件的內容的

還有一點需要注意的是：*在通配符和正則表達式中有其不一樣的地方，在通配符中*可以匹配任意的0個或多個字符，而在正則表達式中他是重復之前的一個或者多個字符，不能獨立使用的。
比如通配符可以用*來匹配任意字符，而正則表達式不行，他只匹配任意長度的前面的字符。

1.通配符

[a-z]或[12]：匹配方括號中指定范圍內的單個字符或方括號列出的其中一個字符。
[!9]：不匹配方括號中所列字符或指定范圍內的單個字符。
* ：匹配0個字符或多個字符。

？：匹配任何單個字符，且不能為空字符。

特別1和2中 * 的用法

2.基礎的正則表達式特殊字符匯整如下：

RE 字符	意義與范例
^word	意義：待搜尋的字串(word)在行首！范例：搜尋行首為 # 開始的那一行，並列出行號 grep -n '^#' regular_express.txt
word$	意義：待搜尋的字串(word)在行尾！范例：將行尾為 ! 的那一行列印出來，並列出行號 grep -n '!$' regular_express.txt
.	意義：代表『一定有一個任意字節』的字符！范例：搜尋的字串可以是 (eve) (eae) (eee) (e e)，但不能僅有 (ee) ！亦即 e 與 e 中間『一定』僅有一個字節，而空白字節也是字節！ grep -n 'e.e' regular_express.txt
\	意義：跳脫字符，將特殊符號的特殊意義去除！范例：搜尋含有單引號 ' 的那一行！ grep -n \' regular_express.txt
*	意義：重復零個到無窮多個的前一個 RE 字符 ab* 匹配a開頭，后面有0個b、1個b、2個b……的字符串 ab.* 匹配ab開頭，后面有任意數量（包括0）、任意字符的字符范例：找出含有 (es) (ess) (esss) 等等的字串，注意，因為 * 可以是 0 個，所以 es 也是符合帶搜尋字串。 grep -n 'ess*' regular_express.txt
[list]	意義：字節集合的 RE 字符，里面列出想要擷取的字節！需要特別留意的是，在 [] 當中謹代表一個待搜尋的字節，例如『 a[afl]y 』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思！范例：搜尋含有 (gl) 或 (gd) 的那一行， grep -n 'g[ld]' regular_express.txt
[n1-n2]	意義：字節集合的 RE 字符，里面列出想要擷取的字節范圍！在字節集合 [] 中的減號 - 是有特殊意義的，他代表兩個字節之間的所有連續字節！但這個連續與否與 ASCII 編碼有關，因此，你的編碼需要配置正確(在 bash 當中，需要確定 LANG 與 LANGUAGE 的變量是否正確！) 例如所有大寫字母則為 [A-Z] 小寫字母 [a-z] 數字[0-9] 三者結合起來 [A-Za-z0-9] 范例：搜尋含有任意數字的那一行 grep -n '[0-9]' regular_express.txt
[^list]	意義：字節集合的 RE 字符，里面列出不要的字串或范圍！那個 ^ 在 [] 內時，代表的意義是『反向選擇』的意思。例如，我不要大寫字節，則為 [^A-Z]。但是，需要特別注意的是，如果以 grep -n [^A-Z] regular_express.txt 來搜尋，卻發現該文件內的所有行都被列出，為什么？因為這個 [^A-Z] 是『非大寫字節』的意思，因為每一行均有非大寫字節，例如第一行的 "Open Source" 就有 p,e,n,o.... 等等的小寫字范例：搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ， grep -n 'oo[^t]' regular_express.txt
\{n,m\}	意義：連續 n 到 m 個的『前一個 RE 字符』意義：若為 \{n\} 則是連續 n 個的前一個 RE 字符，意義：若是 \{n,\} 則是連續 n 個以上的前一個 RE 字符！范例：在 g 與 g 之間有 2 個到 3 個的 o 存在的字串，亦即 (goog)(gooog) grep -n 'go\{2,3\}g' regular_express.txt

RE 字符	意義與范例
+	意義：重復『一個或一個以上』的前一個 RE 字符范例：搜尋 (god) (good) (goood)... 等等的字串。那個 o+ 代表『一個以上的 o 』所以，底下的運行成果會將第 1, 9, 13 行列出來。 egrep -n 'go+d' regular_express.txt
?	意義：『零個或一個』的前一個 RE 字符范例：搜尋 (gd) (god) 這兩個字串。那個 o? 代表『空的或 1 個 o 』所以，上面的運行成果會將第 13, 14 行列出來。有沒有發現到，這兩個案例( 'go+d' 與 'go?d' )的結果集合與 'go*d' 相同？想想看，這是為什么喔！ ^_^ egrep -n 'go?d' regular_express.txt
\|	意義：用或( or )的方式找出數個字串范例：搜尋 gd 或 good 這兩個字串，注意，是『或』！所以，第 1,9,14 這三行都可以被列印出來喔！那如果還想要找出 dog 呢？ egrep -n 'gd\|good' regular_express.txt egrep -n 'gd\|good\|dog' regular_express.txt
()	意義：找出『群組』字串范例：搜尋 (glad) 或 (good) 這兩個字串，因為 g 與 d 是重復的，所以，我就可以將 la 與 oo 列於 ( ) 當中，並以 \| 來分隔開來，就可以啦！ egrep -n 'g(la\|oo)d' regular_express.txt
()+	意義：多個重復群組的判別范例：將『AxyzxyzxyzxyzC』用 echo 叫出，然后再使用如下的方法搜尋一下！ echo 'AxyzxyzxyzxyzC' \| egrep 'A(xyz)+C' 上面的例子意思是說，我要找開頭是 A 結尾是 C ，中間有一個以上的 "xyz" 字串的意思～

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [Shell]正則表達式與通配符通配符與正則表達式正則表達式通配符？和 * 的區別 Linux Bash之正則表達式 shell腳本—正則表達式 shell 正則表達式 shell腳本正則表達式 Shell正則表達式 shell-正則表達式 shell正則表達式

RE 字符	意義與范例
^word	意義：待搜尋的字串(word)在行首！范例：搜尋行首為 # 開始的那一行，並列出行號 grep -n '^#' regular_express.txt
word$	意義：待搜尋的字串(word)在行尾！范例：將行尾為 ! 的那一行列印出來，並列出行號 grep -n '!$' regular_express.txt
.	意義：代表『一定有一個任意字節』的字符！范例：搜尋的字串可以是 (eve) (eae) (eee) (e e)，但不能僅有 (ee) ！亦即 e 與 e 中間『一定』僅有一個字節，而空白字節也是字節！ grep -n 'e.e' regular_express.txt
\	意義：跳脫字符，將特殊符號的特殊意義去除！范例：搜尋含有單引號 ' 的那一行！ grep -n \' regular_express.txt
*	意義：重復零個到無窮多個的前一個 RE 字符 ab* 匹配a開頭，后面有0個b、1個b、2個b……的字符串 ab.* 匹配ab開頭，后面有任意數量（包括0）、任意字符的字符范例：找出含有 (es) (ess) (esss) 等等的字串，注意，因為 * 可以是 0 個，所以 es 也是符合帶搜尋字串。 grep -n 'ess*' regular_express.txt
[list]	意義：字節集合的 RE 字符，里面列出想要擷取的字節！需要特別留意的是，在 [] 當中謹代表一個待搜尋的字節，例如『 a[afl]y 』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思！范例：搜尋含有 (gl) 或 (gd) 的那一行， grep -n 'g[ld]' regular_express.txt
[n1-n2]	意義：字節集合的 RE 字符，里面列出想要擷取的字節范圍！在字節集合 [] 中的減號 - 是有特殊意義的，他代表兩個字節之間的所有連續字節！但這個連續與否與 ASCII 編碼有關，因此，你的編碼需要配置正確(在 bash 當中，需要確定 LANG 與 LANGUAGE 的變量是否正確！) 例如所有大寫字母則為 [A-Z] 小寫字母 [a-z] 數字[0-9] 三者結合起來 [A-Za-z0-9] 范例：搜尋含有任意數字的那一行 grep -n '[0-9]' regular_express.txt
[^list]	意義：字節集合的 RE 字符，里面列出不要的字串或范圍！那個 ^ 在 [] 內時，代表的意義是『反向選擇』的意思。例如，我不要大寫字節，則為 [^A-Z]。但是，需要特別注意的是，如果以 grep -n [^A-Z] regular_express.txt 來搜尋，卻發現該文件內的所有行都被列出，為什么？因為這個 [^A-Z] 是『非大寫字節』的意思，因為每一行均有非大寫字節，例如第一行的 "Open Source" 就有 p,e,n,o.... 等等的小寫字范例：搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ， grep -n 'oo[^t]' regular_express.txt
\{n,m\}	意義：連續 n 到 m 個的『前一個 RE 字符』意義：若為 \{n\} 則是連續 n 個的前一個 RE 字符，意義：若是 \{n,\} 則是連續 n 個以上的前一個 RE 字符！范例：在 g 與 g 之間有 2 個到 3 個的 o 存在的字串，亦即 (goog)(gooog) grep -n 'go\{2,3\}g' regular_express.txt

RE 字符	意義與范例
+	意義：重復『一個或一個以上』的前一個 RE 字符范例：搜尋 (god) (good) (goood)... 等等的字串。那個 o+ 代表『一個以上的 o 』所以，底下的運行成果會將第 1, 9, 13 行列出來。 egrep -n 'go+d' regular_express.txt
?	意義：『零個或一個』的前一個 RE 字符范例：搜尋 (gd) (god) 這兩個字串。那個 o? 代表『空的或 1 個 o 』所以，上面的運行成果會將第 13, 14 行列出來。有沒有發現到，這兩個案例( 'go+d' 與 'go?d' )的結果集合與 'go*d' 相同？想想看，這是為什么喔！ ^_^ egrep -n 'go?d' regular_express.txt
\|	意義：用或( or )的方式找出數個字串范例：搜尋 gd 或 good 這兩個字串，注意，是『或』！所以，第 1,9,14 這三行都可以被列印出來喔！那如果還想要找出 dog 呢？ egrep -n 'gd\|good' regular_express.txt egrep -n 'gd\|good\|dog' regular_express.txt
()	意義：找出『群組』字串范例：搜尋 (glad) 或 (good) 這兩個字串，因為 g 與 d 是重復的，所以，我就可以將 la 與 oo 列於 ( ) 當中，並以 \| 來分隔開來，就可以啦！ egrep -n 'g(la\|oo)d' regular_express.txt
()+	意義：多個重復群組的判別范例：將『AxyzxyzxyzxyzC』用 echo 叫出，然后再使用如下的方法搜尋一下！ echo 'AxyzxyzxyzxyzC' \| egrep 'A(xyz)+C' 上面的例子意思是說，我要找開頭是 A 結尾是 C ，中間有一個以上的 "xyz" 字串的意思～