Linux基礎-正則表達式整理---------------grep、sed、awk


目錄:

   Ⅰ:正則表達式

   Ⅱ:作業

Ⅰ:正則表達式

正則就是用一些具有特殊含義的符號組合到一起(稱為正則表達式)來描述字符或者字符串的方法。或者說:正則就是用來描述一類事物的規則。

在linux中,通配符是由shell解釋的,而正則表達式則是由命令解釋的,三種文本處理工具/命令:grep、sed、awk

正則介紹:^ 以什么開頭(同一行)
         $
以什么結尾(同一行)

         . 除了換行符以外的任意單個字符

         * 緊挨的左邊的第一個字符出現零個到無窮個

         + 緊挨的左邊的第一個字符出現1個到無窮個

         ? 緊挨的左邊的第一個字符出現0次到1次

        .* 所有字符

        {n}左邊的左邊的那一個字符出現n次的

        {2,4}左邊的那一個字符出現2到4個的(表示范圍的),例如:2 3 4  

        {2,}左邊的那一個字符出現2到無窮個的(表示范圍的),例如:2 3 4 5..........到無窮    

        [] 字符組內的任一字符

        [^] 對字符組內的每個字符取反(不匹配字符組內的每個字符)

       ^[^] 非字符組內的字符開頭的行

       [a-z] a到z的所有小寫字母   例如:a  b  c.....z

       [A-Z] A到Z的所有大寫字母  例如:A  B  C .....  Z

       [a-Z] a到Z的所有小寫和大寫字母  例如:a A  b  B   ........z  Z

       [0-9] 數字0到9    例如:0 1 2 ....9

       \< 單詞頭 單詞一般以空格或特殊字符做分隔,連續的字符串被當做單詞

       \> 單詞尾

 

grep種類:grep      fgrep      pgrep     egrep  

                      -n  :顯示行號

                      -o  :只顯示匹配的內容

                      -q  :靜默模式,沒有任何輸出,得用$?來判斷執行成功沒有,即有沒有過濾到想要的內容

                      -l  :如果匹配成功,則只將文件名打印出來,失敗則不打印,通常-rl一起用,grep -rl 'root' /etc 

                      -A  :如果匹配成功,則將匹配行及其后n行一起打印出來

                      -B  :如果匹配成功,則將匹配行及其前n行一起打印出來

                      -C  :如果匹配成功,則將匹配行及其前后n行一起打印出來

                      --color

                      -c  :如果匹配成功,則將匹配到的行數打印出來

                      -E  :等於egrep,擴展

                      -i  :忽略大小寫 

                      -v  :取反,不匹配

                      -w:匹配單詞

                      -rl :遞歸尋找並顯示文件名

 

sed:流編輯器 stream editer,是以行為單位的處理程序
       
  a 后插

             c 替換

             i 前插

            d 刪除

            p 打印匹配的行 一般和 -n 參數連用,以屏蔽默認輸出

            r 從文件中讀入

            w 寫入到文件中作業二:grep作業(正則表達式及字符處理)

            ! 命令取反 

           {} 命令組合 命令用分號分隔 {1h;G} 可以理解為 -e 參數的另一種寫法

            = 打印行號(輸入行的號碼,而非處理的次數行號) 

            n 讀入下一行到模式空間 

            N 而是追加下一行到模式空間,再把當前行和下一行同時應用后面的命令

            s 字符串替換

 

awk

      -F 可以定義指定分隔符:(冒號)

      -v 定義變量並賦值 也可以借用次方式從shell變量中引入

      NF表示當前以分隔符(:)為分隔單位的行有幾段內容

      NR 表示行號

      FNR表示讀入行所在文件中的行數

        -v 定義變量並賦值


              == 判斷;>=大於等於;<=小於等於;!=  非;>大於;<小於; ~ 使用正則定位 ; !~正則取反

         &&且

         ||或

      |sort  |uniq        配續去重(排列順序再去除重讀的)

      du -sh     統計文件大小    

       find / -size +30M 找出大於30M的文件
       find / -size +10M -size -30M 找出大於10M小於30M的文件

 

Ⅱ:作業

作業一:grep作業(正則表達式及字符處理)

目標文件/etc/passwd,使用grep命令或egrep
1.顯示出所有含有root的行:

grep 'root' /etc/passwd 

 

2.輸出任何包含bash的所有行,還要輸出緊接着這行的上下各兩行的內容:

grep `bash` -C 2 /etc/passwd 


3. 顯示出有多少行含有nologin。

grep -c 'nologin' /etc/passwd


4.顯示出那些行含有root,並將行號一塊輸出。

grep -n 'nologin' /etc/passwd


5.顯示出文件中

grep -l 'root' /etc/passwd


6.新建用戶
abominable
abominate
anomie
atomize
編寫正則表達式,將他們匹配出來

egrep 'a.omi(nabl|nat|z|)e' /etc/passwd


7.建四個用戶
Alex213sb
Wpq2222b
yH438PIG
egon666
egon

過濾出用戶名組成是字母+數字+字母的行

egrep '^[a-Z]+[0-9]+[a-Z]+' /etc/passwd


8.顯示出/etc目錄下所有包含root的文件名

grep -w 'root' /etc


9. 過濾掉/etc/ssh/sshd_config內所有注釋和所有空行

grep -v '^#' /etc/ssh/sshd_config |grep -v '^ *$'


作業二:Sed作業:以/etc/passwd文件為模板

1,刪除文件每行的第一個字符。

 sed -r 's/^(.)(.*)/\2/' /etc/passwd

2,刪除文件每行的第二個字符。

 sed -r 's/^(.)(.)(.*)/\1\3/' /etc/passwd

3,刪除文件每行的最后一個字符。

 sed -r 's/(.*)(.)$/\1/' /etc/passwd

4,刪除文件每行的倒數第二個字符。

 sed -r 's/(.*)(.)(.)$/\1\3/' /etc/passwd

5,刪除文件每行的第二個單詞。

 sed -r 's/^([a-Z]+)([^a-Z]+)([a-Z]+)([^a-Z]+)/\1\2\4/' /etc/passwd

6,刪除文件每行的倒數第二個單詞。

 sed -r 's/([^a-Z]+)([a-Z]+)([^a-Z]+)([a-Z]+)$/\1\3\4/' /etc/passwd

7,刪除文件每行的最后一個單詞。

 sed -r 's/([^a-Z]+)([a-Z]+)([^a-Z]+)([a-Z]+)$/\1\2\3/' /etc/passwd

8,交換每行的第一個字符和第二個字符。

 sed -r 's/^(.)(.*)(.)$/\3\2\1/' /etc/passwd

9,交換每行的第一個字符和第二個單詞。

 sed -r 's/^(.)([a-Z]+)([^a-Z]+)([a-Z]+)([^a-Z]+)/\4\2\3\1\5/' /etc/passwd

10,交換每行的第一個單詞和最后一個單詞。

  sed -r 's/^([a-Z]+)([^a-Z]+)(.*)([^a-Z]+)([a-Z]+)$/\5\2\3\4\1/' /etc/passwd

11,刪除一個文件中所有的數字。

  sed -r 's/[0-9]//g' /etc/passwd

12,刪除每行開頭的所有空格。

  sed -r 's/^ *//g' /etc/passwd

13,用制表符替換文件中出現的所有空格。

  sed -r 's/ /\t/g' /etc/passwd

14,把所有大寫字母用括號()括起來。

  sed -r 's/[A-Z]/(&)/g' /etc/passwd

15,打印每行3次。

  sed 'p;p' /etc/passwd

16,只顯示每行的第一個單詞。

  sed -r 's/^([a-Z]+)([^a-Z]+)(.*)/\1/' /etc/passwd

17,打印每行的第一個單詞和第三個單詞。

  sed -r 's/^([a-Z]+)([^a-Z]+)([a-Z]+)([^a-Z]+)([a-Z]+)([^a-Z]+)/\5\2\3\4\1\6/' /etc/passwd

18,用命令獲取格式為 mm/yy/dd 的日期格式,結合管道,將其換成 mm;yy;dd格式

      date | sed -r ' s/ /; /g'

作業三:awk文本處理

1)打印uid在0~40范圍內的用戶名

awk -F: '$3>0 && $3<40{print $1,$3}' passwd

2)打印第5-10行的行號和用戶名

awk -F: 'NR>=5 && NR<=10{print NR $1}' passwd

3)打印奇數行

awk '(NR%2){print $0}' passwd 

4)打印偶數行

awk '!(NR%2){print $0}' passwd 

5)打印字段數大於5的行

awk -F: '(NF>3){print $0}' passwd

6)打印UID不等於GID的用戶名

awk -F: '($3 != $4){print $0}' passwd 

7)打印沒有指定shell的用戶

awk -F: '($NF != "/bin/bash"){print $0}' passwd

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM