一 什么是正則
正則就是用一些具有特殊含義的符號組合到一起(稱為正則表達式)來描述字符或者字符串的方法。或者說:正則就是用來描述一類事物的規則。
生活中處處都是正則:
比如我們描述:4條腿
你可能會想到的是四條腿的動物或者桌子,椅子等
繼續描述:4條腿,活的
就只剩下四條腿的動物這一類了
在linux中,通配符是由shell解釋的,而正則表達式則是由命令解釋的,下面我們就為大家介紹grep文本處理命令,它也可以解釋正則。
二 grep
參數
-n :顯示行號
-o :只顯示匹配的內容
-q :靜默模式,沒有任何輸出,得用$?來判斷執行成功沒有,即有沒有過濾到想要的內容
-l :如果匹配成功,則只將文件名打印出來,失敗則不打印,通常-rl一起用,grep -rl 'root' /etc
-A :如果匹配成功,則將匹配行及其后n行一起打印出來
-B :如果匹配成功,則將匹配行及其前n行一起打印出來
-C :如果匹配成功,則將匹配行及其前后n行一起打印出來
--color
-c :如果匹配成功,則將匹配到的行數打印出來
-E :等於egrep,擴展
-i :忽略大小寫
-v :取反,不匹配
-w:匹配單詞,單詞的意思是特殊符號隔開的英文字母組合,對象中的正則表達式都會當成單詞(前后有特殊符號)。
[root@MiWiFi-R3-srv ~]# cat a.txt root123 ROot asdf Root_123 rOOtss root 123 [root@MiWiFi-R3-srv ~]# grep -i "root" a.txt root123 ROot asdf Root_123 rOOtss root 123 [root@MiWiFi-R3-srv ~]# grep -w "root" a.txt root 123
三 grep種類
grep 全面搜索正則表達式並把行打印出來
fgrep 它搜索字符串而不是搜索匹配表達式的模式。fgrep 命令使用快速的壓縮算法。$, *, [, |, (, )
和\
等字符串被 fgrep 命令按字面意思解釋。這些字符並不解釋為正則表達式
pgrep 以名稱為依據從運行進程隊列中查找進程,並顯示查找到的進程id。
egrep 用於在文件內查找指定的字符串。egrep執行效果與grep -E
相似,使用的語法及參數可參照grep指令,與grep的不同點在於解讀字符串的方法。
四 正則介紹
正則表達式 |
描述 |
示例 |
Basic RegEx |
Extended RegEx |
Python RegEx |
Perl regEx |
\ |
轉義符,將特殊字符進行轉義,忽略其特殊意義 |
a\.b匹配a.b,但不能匹配ajb,.被轉義為特殊意義 |
\ |
\ |
\ |
\ |
^ |
匹配行首,awk中,^則是匹配字符串的開始 |
^tux匹配以tux開頭的行 |
^ |
^ |
^ |
^ |
$ |
匹配行尾,awk中,$則是匹配字符串的結尾 |
tux$匹配以tux結尾的行 |
$ |
$ |
$ |
$ |
. |
匹配除換行符\n之外的任意單個字符,awk則中可以 |
ab.匹配abc或bad,不可匹配abcd或abde,只能匹配單字符 |
. |
. |
. |
. |
[] |
匹配包含在[字符]之中的任意一個字符 |
coo[kl]可以匹配cook或cool |
[] |
[] |
[] |
[] |
[^] |
匹配[^字符]之外的任意一個字符(不匹配字符組內的每個字符) |
123[^45]不可以匹配1234或1235,1236、1237都可以 |
[^] |
[^] |
[^] |
[^] |
[-] |
匹配[]中指定范圍內的任意一個字符,要寫成遞增 |
[0-9]可以匹配1、2或3等其中任意一個數字 |
[-] |
[-] |
[-] |
[-] |
? |
匹配之前的項1次或者0次 |
colou?r可以匹配color或者colour,不能匹配colouur |
不支持 |
? |
? |
? |
+ |
匹配之前的項1次或者多次 |
sa-6+匹配sa-6、sa-666,不能匹配sa- |
不支持 |
+ |
+ |
+ |
* |
匹配之前的項0次或者多次 |
co*l匹配cl、col、cool、coool等 |
* |
* |
* |
* |
() |
匹配表達式,創建一個用於匹配的子串 |
ma(tri)?匹配max或maxtrix |
不支持 |
() |
() |
() |
{n} |
匹配之前的項n次,n是可以為0的正整數 |
[0-9]{3}匹配任意一個三位數,可以擴展為[0-9][0-9][0-9] |
不支持 |
{n} |
{n} |
{n} |
{n,} |
之前的項至少需要匹配n次 |
[0-9]{2,}匹配任意一個兩位數或更多位數 |
不支持 |
{n,} |
{n,} |
{n,} |
{n,m} |
指定之前的項至少匹配n次,最多匹配m次,n<=m |
[0-9]{2,5}匹配從兩位數到五位數之間的任意一個數字 |
不支持 |
{n,m} |
{n,m} |
{n,m} |
| |
交替匹配|兩邊的任意一項 |
ab(c|d)匹配abc或abd |
不支持 |
| |
| |
| |
應用舉例:
.* 所有字符 |
^[^] 非字符組內的字符開頭的行 |
[a-z] 小寫字母 |
[A-Z] 大寫字母 |
[a-Z] 小寫和大寫字母 |
[0-9] 數字 |
\< 單詞頭 單詞一般以空格或特殊字符做分隔,連續的字符串被當做單詞 |
\> 單詞尾 |
擴展正則 sed 加 -r 參數 或轉義 |
grep 加 -E 或 egrep 或轉義 |
sed -n '/roo\?/p' /etc/passwd |
sed -rn '/roo?/p' /etc/passwd |
abc|def abc或def |
a(bc|de)f abcf 或 adef |
x\{m\} x出現m次 |
x\{m,\} x出現m次至多次(至少m次) |
x\{m,n\} x出現m次至n次 |
posix定義的字符分類
[:alnum:] Alphanumeric characters.
匹配范圍為 [a-zA-Z0-9]
[:alpha:] Alphabetic characters.
匹配范圍為 [a-zA-Z]
[:blank:] Space or tab characters.
匹配范圍為 空格和TAB鍵
[:cntrl:] Control characters.
匹配控制鍵 例如 ^M 要按 ctrl+v 再按回車 才能輸出
[:digit:] Numeric characters.
匹配所有數字 [0-9]
[:graph:] Characters that are both printable and visible. (A space is print-
able, but not visible, while an a is both.)
匹配所有可見字符 但不包含空格和TAB 就是你在文本文檔中按鍵盤上能用眼睛觀察到的所有符號
[:lower:] Lower-case alphabetic characters.
小寫 [a-z]
[:print:] Printable characters (characters that are not control characters.)
匹配所有可見字符 包括空格和TAB
能打印到紙上的所有符號
[:punct:] Punctuation characters (characters that are not letter, digits, con-
trol characters, or space characters).
特殊輸入符號 +-=)(*&^%$#@!~`|\"'{}[]:;?/>.<,
注意它不包含空格和TAB
這個集合不等於^[a-zA-Z0-9]
[:space:] Space characters (such as space, tab, and formfeed, to name a few).
[:upper:] Upper-case alphabetic characters.
大寫 [A-Z]
[:xdigit:] Characters that are hexadecimal digits.
16進制數 [0-f]
使用方法:
[root@seker ~]# grep --color '[[:alnum:]]' /etc/passwd
定義變量名的邊界
[root@MiWiFi-R3-srv ~]# rest_mem=20 [root@MiWiFi-R3-srv ~]# echo ${rest_mem}% 20%
五 運算符
算術運算符:+、-、*、/、%
[root@MiWiFi-R3-srv ~]# echo $[3+1] 4
關系操作:與(())連用
< > <= >= == != && ||
test命令相關,[]可以達到一樣的效果 [root@MiWiFi-R3-srv ~]# x=1 [root@MiWiFi-R3-srv ~]# [ $x -gt 1 ] [root@MiWiFi-R3-srv ~]# echo $? 0
賦值運算符
= += *= /= %=
[root@MiWiFi-R3-srv ~]# x=10 [root@MiWiFi-R3-srv ~]# ((x%3)) [root@MiWiFi-R3-srv ~]# echo $x 10 [root@MiWiFi-R3-srv ~]# [root@MiWiFi-R3-srv ~]# ((x%=3)) [root@MiWiFi-R3-srv ~]# echo $x 1
shell里的所有計算器
$[] (()) $(()) expr bc bc -l
浮點運算:yum install bc -y
[root@MiWiFi-R3-srv ~]# echo 'scale=2;1/3'|bc -l .33
測試操作
命令執行后會返回到一個系統變量中 $?
如果$?值為0 表示命令執行成功 否則為失敗
測試命令 test [ ] [[ ]] (( ))
打開man test 逐一介紹每個參數
測試文件狀態 -d 目錄 -s 文件長度 > 0、非空 -f 正規文件 -w 可寫 -r 可讀 -x 可執行 -L 符號連接 -u 文件有 suid 位設置
字符串測試
= 兩個字符串相等 != 兩個字符串不相等 -z 空串 -n 非空串 [root@MiWiFi-R3-srv ~]# var1='abc' [root@MiWiFi-R3-srv ~]# var2='123' [root@MiWiFi-R3-srv ~]# [ $var1 == $var2 ] [root@MiWiFi-R3-srv ~]# echo $? 1
測試數值
-eq 等於 -ne 不等於 -gt 大於 -lt 小於 -ge 大於等於 -le 小於等於 [root@MiWiFi-R3-srv ~]# [ 10000 -gt 250 ] #不要使用大於號小於號等於號等,要使用man test中規定的,詳見下一小節4拓展 [root@MiWiFi-R3-srv ~]# echo $? 0
拓展測試符號 [[ ]] (())
數字測試符號 # [ 10 < 2 ] # 語法錯誤 -bash: 2: 沒有那個文件或目錄 # # [[ 2 > 10 ]] # 結果錯誤 # echo $? 0 # [[ 20 > 10 ]] # 正確 # echo $? 0 # (( 10 < 20 )) # echo $? 0 字符測試 # [ "aa" = "aa" ] # echo $? 0 # [[ "aa" = "aa" ]] # echo $? 0 # (( "aa" = "aa" )) #結果錯誤 # echo $? 1 混合測試 # [ a = a -a 10 < 20 ] -bash: 20: 沒有那個文件或目錄 [root@seker ~]# [[ a = a -a 10 < 20 ]] -bash: syntax error in conditional expression -bash: syntax error near `-a' [root@seker ~]# [[ a = a && 10 < 20 ]] [root@seker ~]# echo $? 0 [root@seker ~]# [[ a = a || 10 < 20 ]] [root@seker ~]# echo $? 0 [root@seker ~]# (( a = a || 10 < 20 )) [root@seker ~]# echo $? 0 [root@seker ~]# (( a = a && 10 < 20 )) [root@seker ~]# echo $? 0 [root@seker ~]# 結論: 比較數字,使用(( )) 其他測試使用 [[ ]] 包含數字比較的混合測試,使用[[ expr1 && expr2 ]] (( expr1 || expr2 )) 兩個文件的比較 FILE1 -ef FILE2 測試兩個文件是否是相同的inode 有時為了找到同一個INODE號的文件 更傾向於使用 find 命令的 -inum 或 --samefile FILE1 -nt FILE2 FILE1 is newer (modification date) than FILE2 FILE1 -ot FILE2 FILE1 is older than FILE2