SHELL —— grep命令+正則表達式

本文轉載自查看原文 2017-06-02 16:38 16632

一什么是正則

正則就是用一些具有特殊含義的符號組合到一起（稱為正則表達式）來描述字符或者字符串的方法。或者說：正則就是用來描述一類事物的規則。
　　生活中處處都是正則：
　　比如我們描述：4條腿
　　你可能會想到的是四條腿的動物或者桌子，椅子等
　　繼續描述：4條腿，活的
　　就只剩下四條腿的動物這一類了

在linux中，通配符是由shell解釋的，而正則表達式則是由命令解釋的，下面我們就為大家介紹grep文本處理命令，它也可以解釋正則。

二 grep

參數

-n :顯示行號
-o :只顯示匹配的內容
-q :靜默模式，沒有任何輸出，得用$?來判斷執行成功沒有，即有沒有過濾到想要的內容

-l ：如果匹配成功，則只將文件名打印出來，失敗則不打印，通常-rl一起用，grep -rl 'root' /etc
-A :如果匹配成功，則將匹配行及其后n行一起打印出來
-B  :如果匹配成功，則將匹配行及其前n行一起打印出來
-C  :如果匹配成功，則將匹配行及其前后n行一起打印出來
--color
-c  :如果匹配成功，則將匹配到的行數打印出來
-E :等於egrep，擴展
-i ：忽略大小寫

-v :取反，不匹配
-w：匹配單詞，單詞的意思是特殊符號隔開的英文字母組合，對象中的正則表達式都會當成單詞（前后有特殊符號）。

[root@MiWiFi-R3-srv ~]# cat a.txt 
root123
ROot asdf
Root_123
rOOtss
root 123
[root@MiWiFi-R3-srv ~]# grep -i "root" a.txt 
root123
ROot asdf
Root_123
rOOtss
root 123
[root@MiWiFi-R3-srv ~]# grep -w "root" a.txt 
root 123

三 grep種類
grep   全面搜索正則表達式並把行打印出來
fgrep   它搜索字符串而不是搜索匹配表達式的模式。fgrep 命令使用快速的壓縮算法。$, *, [, |, (, )和\等字符串被 fgrep 命令按字面意思解釋。這些字符並不解釋為正則表達式
pgrep   以名稱為依據從運行進程隊列中查找進程，並顯示查找到的進程id。
egrep   用於在文件內查找指定的字符串。egrep執行效果與grep -E相似，使用的語法及參數可參照grep指令，與grep的不同點在於解讀字符串的方法。

四正則介紹

正則表達式	描述	示例	Basic RegEx	Extended RegEx	Python RegEx	Perl regEx
\	轉義符，將特殊字符進行轉義，忽略其特殊意義	a\.b匹配a.b，但不能匹配ajb，.被轉義為特殊意義	\	\	\	\
^	匹配行首，awk中，^則是匹配字符串的開始	^tux匹配以tux開頭的行	^	^	^	^
$	匹配行尾，awk中，$則是匹配字符串的結尾	tux$匹配以tux結尾的行	$	$	$	$
.	匹配除換行符\n之外的任意單個字符，awk則中可以	ab.匹配abc或bad，不可匹配abcd或abde，只能匹配單字符	.	.	.	.
[]	匹配包含在[字符]之中的任意一個字符	coo[kl]可以匹配cook或cool	[]	[]	[]	[]
[^]	匹配[^字符]之外的任意一個字符（不匹配字符組內的每個字符)	123[^45]不可以匹配1234或1235，1236、1237都可以	[^]	[^]	[^]	[^]
[-]	匹配[]中指定范圍內的任意一個字符，要寫成遞增	[0-9]可以匹配1、2或3等其中任意一個數字	[-]	[-]	[-]	[-]
?	匹配之前的項1次或者0次	colou?r可以匹配color或者colour，不能匹配colouur	不支持	?	?	?
+	匹配之前的項1次或者多次	sa-6+匹配sa-6、sa-666，不能匹配sa-	不支持	+	+	+
*	匹配之前的項0次或者多次	co*l匹配cl、col、cool、coool等	*	*	*	*
()	匹配表達式，創建一個用於匹配的子串	ma(tri)?匹配max或maxtrix	不支持	()	()	()
{n}	匹配之前的項n次，n是可以為0的正整數	[0-9]{3}匹配任意一個三位數，可以擴展為[0-9][0-9][0-9]	不支持	{n}	{n}	{n}
{n,}	之前的項至少需要匹配n次	[0-9]{2,}匹配任意一個兩位數或更多位數	不支持	{n,}	{n,}	{n,}
{n,m}	指定之前的項至少匹配n次，最多匹配m次，n<=m	[0-9]{2,5}匹配從兩位數到五位數之間的任意一個數字	不支持	{n,m}	{n,m}	{n,m}
\|	交替匹配\|兩邊的任意一項	ab(c\|d)匹配abc或abd	不支持	\|	\|	\|

應用舉例：

.* 所有字符

^[^] 非字符組內的字符開頭的行

[a-z] 小寫字母

[A-Z] 大寫字母

[a-Z] 小寫和大寫字母

[0-9] 數字

\< 單詞頭單詞一般以空格或特殊字符做分隔,連續的字符串被當做單詞

\> 單詞尾

擴展正則 sed 加 -r 參數或轉義

grep 加 -E 或 egrep 或轉義

sed -n '/roo\?/p' /etc/passwd

sed -rn '/roo?/p' /etc/passwd

abc|def abc或def

a(bc|de)f abcf 或 adef

x\{m\} x出現m次

x\{m,\} x出現m次至多次(至少m次)

x\{m,n\} x出現m次至n次

posix定義的字符分類

[:alnum:] Alphanumeric characters.

匹配范圍為 [a-zA-Z0-9]

[:alpha:] Alphabetic characters.

匹配范圍為 [a-zA-Z]

[:blank:] Space or tab characters.

匹配范圍為空格和TAB鍵

[:cntrl:] Control characters.

匹配控制鍵例如 ^M 要按 ctrl+v 再按回車才能輸出

[:digit:] Numeric characters.

匹配所有數字 [0-9]

[:graph:] Characters that are both printable and visible. (A space is print-

able, but not visible, while an a is both.)

匹配所有可見字符但不包含空格和TAB 就是你在文本文檔中按鍵盤上能用眼睛觀察到的所有符號

[:lower:] Lower-case alphabetic characters.

小寫 [a-z]

[:print:] Printable characters (characters that are not control characters.)

匹配所有可見字符包括空格和TAB

能打印到紙上的所有符號

[:punct:] Punctuation characters (characters that are not letter, digits, con-

trol characters, or space characters).

特殊輸入符號 +-=)(*&^%$#@!~`|\"'{}[]:;?/>.<,

注意它不包含空格和TAB

這個集合不等於^[a-zA-Z0-9]

[:space:] Space characters (such as space, tab, and formfeed, to name a few).

[:upper:] Upper-case alphabetic characters.

大寫 [A-Z]

[:xdigit:] Characters that are hexadecimal digits.

16進制數 [0-f]

使用方法:

[root@seker ~]# grep --color '[[:alnum:]]' /etc/passwd

定義變量名的邊界

[root@MiWiFi-R3-srv ~]# rest_mem=20
[root@MiWiFi-R3-srv ~]# echo ${rest_mem}%
20%

五運算符

算術運算符：+、-、*、/、%

[root@MiWiFi-R3-srv ~]# echo $[3+1]
4

關系操作：與(（）)連用

< > <= >= == != && ||

test命令相關，[]可以達到一樣的效果
[root@MiWiFi-R3-srv ~]# x=1
[root@MiWiFi-R3-srv ~]# [ $x -gt 1 ]
[root@MiWiFi-R3-srv ~]# echo $?
0

賦值運算符

= += *= /= %=

[root@MiWiFi-R3-srv ~]# x=10
[root@MiWiFi-R3-srv ~]# ((x%3))
[root@MiWiFi-R3-srv ~]# echo $x
10
[root@MiWiFi-R3-srv ~]# 
[root@MiWiFi-R3-srv ~]# ((x%=3))
[root@MiWiFi-R3-srv ~]# echo $x
1

shell里的所有計算器
$[] (()) $(()) expr bc bc -l

浮點運算：yum install bc -y

[root@MiWiFi-R3-srv ~]# echo 'scale=2;1/3'|bc -l
.33

測試操作

命令執行后會返回到一個系統變量中 $?
如果$?值為0 表示命令執行成功否則為失敗

測試命令 test [ ] [[ ]] (( ))
打開man test 逐一介紹每個參數

測試文件狀態
-d 目錄
-s 文件長度 > 0、非空
-f 正規文件
-w 可寫

-r 可讀

-x 可執行

-L 符號連接

-u 文件有 suid 位設置

字符串測試

= 兩個字符串相等
!= 兩個字符串不相等
-z 空串
-n 非空串

[root@MiWiFi-R3-srv ~]# var1='abc'
[root@MiWiFi-R3-srv ~]# var2='123'
[root@MiWiFi-R3-srv ~]# [ $var1 == $var2 ]
[root@MiWiFi-R3-srv ~]# echo $?
1

測試數值

-eq 等於
-ne 不等於
-gt 大於
-lt 小於
-ge 大於等於
-le 小於等於

[root@MiWiFi-R3-srv ~]# [ 10000 -gt 250 ] #不要使用大於號小於號等於號等，要使用man test中規定的，詳見下一小節4拓展
[root@MiWiFi-R3-srv ~]# echo $?
0

拓展測試符號 [[ ]] (())

數字測試符號
# [ 10 < 2 ] # 語法錯誤
-bash: 2: 沒有那個文件或目錄
# 

# [[ 2 > 10 ]] # 結果錯誤
# echo $?
0
# [[ 20 > 10 ]] # 正確
# echo $?
0
# (( 10 < 20 ))
# echo $?
0

字符測試
# [ "aa" = "aa" ]
# echo $?
0
# [[ "aa" = "aa" ]]
# echo $?
0
# (( "aa" = "aa" )) #結果錯誤
# echo $?
1
混合測試
# [ a = a -a 10 < 20 ]
-bash: 20: 沒有那個文件或目錄
[root@seker ~]# [[ a = a -a 10 < 20 ]]
-bash: syntax error in conditional expression
-bash: syntax error near `-a'
[root@seker ~]# [[ a = a && 10 < 20 ]]
[root@seker ~]# echo $?
0
[root@seker ~]# [[ a = a || 10 < 20 ]]
[root@seker ~]# echo $?
0
[root@seker ~]# (( a = a || 10 < 20 ))
[root@seker ~]# echo $?
0
[root@seker ~]# (( a = a && 10 < 20 ))
[root@seker ~]# echo $?
0
[root@seker ~]# 
結論: 
比較數字,使用(( ))
其他測試使用 [[ ]]
包含數字比較的混合測試,使用[[ expr1 && expr2 ]] (( expr1 || expr2 ))

兩個文件的比較
FILE1 -ef FILE2
測試兩個文件是否是相同的inode
有時為了找到同一個INODE號的文件 更傾向於使用 find 命令的 -inum 或 --samefile

FILE1 -nt FILE2
FILE1 is newer (modification date) than FILE2

FILE1 -ot FILE2
FILE1 is older than FILE2

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 shell--grep命令+正則表達式+基本語法 shell grep正則表達式正則表達式grep命令 grep命令及正則表達式 shell腳本-grep和正則表達式 Linux--shell grep與正則表達式--04 grep命令使用-正則表達式（zz） linux命令find,grep,正則表達式 grep命令詳解與正則表達式 Linux 命令——grep | 正則表達式

SHELL —— grep命令+正則表達式

一 什么是正則

二 grep

五 運算符

免責聲明！

一什么是正則

五運算符