這篇文章主要是我參考命令的,直接復制粘貼,有問題請拍磚
A. sed執行模板=sed ‘模式{命令1;命令2}’ 即逐行讀入模式空間,執行命令,最后輸出打印出來
B. p打印當前模式空間所有內容,追加到默認輸出之后;P打印當前模式空間開端至\n的內容,並追加到默認輸出之前。
Sed並不對每行末尾\n進行處理,但是對N命令追加的行間\n進行處理,因為此時sed將兩行看做一行。
C. n命令
n命令簡單來說就是提前讀取下一行,覆蓋模型空間前一行,然后執行后續命令。然后再讀取新行,對新讀取的內容重頭執行sed。
例子:從aaa文件中取出偶數行
[root@localhost ~]# cat a.txt
This is 1
This is 2
This is 3
This is 4
This is 5
[root@localhost ~]# sed –n ‘n;p’ a.txt
This is 2
This is 4
[root@localhost ~]#
注釋:
讀取This is 1,執行n命令,此時模式空間為This is 2,
執行p, 打印模式空間內容This is 2,之后讀取This is 3,
執行n命令,此時模式空間為This is 4,
執行p,打印模式空間內容This is 4,之后讀取This is 5,
執行n命令,因為沒有了,所以退出,並放棄p命令。
因此,最終打印出來的就是偶數行。
N命令簡單來說就是追加下一行到模式空間,同時將兩行看做一行,但是兩行之間依然含有\n換行符,然后執行后續命令。然后再讀取新行,對新讀取的內容重頭執行sed。此時,新讀取的行會覆蓋之前的行(之前的兩行已經合並為一行)。
例子:從aaa文件中讀取奇數行
[root@localhost ~]# sed –n ‘N;P’ a.txt -----因為讀取第5行時,執行N,發現沒有第6行,不滿足,就退出,放棄P命令
This is 1
This is 3
[root@localhost ~]# sed –n ‘$!N;P’ a.txt
This is 1
This is 3
This is 5
[root@localhost ~]#
注釋中1代表This is 1;2代表This is 2 以此類推
注釋:
讀取1,$!條件滿足(不是尾行),執行N命令,得出1\n2,執行P,打印得1,
讀取3,$!條件滿足(不是尾行),執行N命令,得出3\n4,執行P,打印得3,
讀取5,$!條件不滿足,跳過N,執行P,打印得5
D. d命令
d命令是刪除當前模式空間內容(不再傳至標准輸出), 並放棄之后的命令,並對新讀取的內容,重頭執行sed。
[root@localhost ~]# sed ‘n;d’ a.txt
This is 1
This is 3
This is 5
[root@localhost ~]#
注釋:
讀取1,執行n,得出2,執行d,刪除2,得空,
以此類推,讀取3,執行n,得出4,執行d,刪除4,得空,
但是讀取5時,因為n無法執行,所以d不執行。因無-n參數,故輸出1\n3\n5
D命令是刪除當前模式空間開端至\n的內容(不在傳至標准輸出), 放棄之后的命令,但是對剩余模式空間重新執行sed。
Sed ‘N;D’ aaa
This is 5
注釋:
讀取1,執行N,得出1\n2,執行D,得出2,執行N,得出2\n3,執行D,得出3,
依此類推,得出5,執行N,條件失敗退出,因無-n參數,故輸出5
E. y命令:對之前匹配的字符逐個替換
[root@localhost ~]# awk ‘{print $0”h”}’ a.txt | sed ‘y/his/HIS/’
THIS IS 1H
THIS IS 2H
THIS IS 3H
THIS IS 4H
THIS IS 5H
[root@localhost ~]#
此外,如果需要對某個字符串進行大小寫轉換,則可使用如下方法
sed ‘s/\b[a-z]\b/\u&/g’ ddd
This is A and A is 1
This is B and B is 2
This is C and C is 3
This is D and D is 4
This is E and E is 5
F. h命令,H命令,g命令,G命令
h命令是將當前模式空間中內容覆蓋至緩存區,
H命令是將當前模式空間中的內容追加至緩存區
g命令是將當前緩存區中內容覆蓋至模式空間,
G命令是將當前緩存區中的內容追加至模式空間
[root@wmsvmpc ~]# sed –e ‘/101/h’ –e ‘$G’ cs1.txt
PBCSPOFT0101 6
PBCSPOFT0102 0
PBCSPOFT0103 8
PB\CSPOFT0104 0
PBCSPOFT0101 6
[root@wmsvmpc ~]#
在sed處理文件的時候,每一行都被保存在一個叫模式空間的臨時緩沖區中,
除非行被刪除或者輸出被取消,否則所有被處理的行都將打印在屏幕上。
接着模式空間被清空,並存入新的一行等待處理。
在上面的例子里,匹配test的行被找到后,將存入模式空間,
h命令將其復制並存入一個稱為保持緩存區的特殊緩沖區內。
第二條語句的意思是,當到達最后一行后,G命令取出保持緩沖區的行,
然后把它放回模式空間中,然后被打印(也就末尾)。
[root@wmsvmpc ~]# sed –e ‘/101/h’ –e ‘/102/G’ cs1.txt #追加到包含102的行的下一行
PBCSPOFT0101 6
PBCSPOFT0102 0
PBCSPOFT0101 6
PBCSPOFT0103 8
PB\CSPOFT0104 0
將ddd文件中數字和字母互換,並將字母大寫
cat ddd.sed
h
{
s/.*is \(.*\) and .*/\1/
y/abcde/ABCDE/
G
s/\(.*\)\n\(.*is \).*\(and \).*\(is \)\(.*\)/\2\5 \3\5 \4\1/
}
sed –f ddd.sed ddd
This is 1 and 1 is A
This is 2 and 2 is B
This is 3 and 3 is C
This is 4 and 4 is D
This is 5 and 5 is E
注釋:
讀取1,執行h,復制到緩存區,執行s,模式空間得到匹配到的字母a,
然后執行y,將a轉成A,執行G,追加緩存區內容到模式空間,得A\nThis is a and a is 1;
執行s,重新排列,得出This is 1 and 1 is A;以此類推,得出結果。
這里需要注意的是匹配的內容中,空格一定要處理好,
空格處理不對,會造成第二次s匹配錯誤,無法執行重新排列或排列錯誤
G. x命令
x命令是將當前緩存區和模式空間內容互換
[root@wmsvmpc ~]# sed –e ‘/101/h’ –e ‘/102/x’ cs1.txt #互換模式空間和保持緩沖區的內容。也就是把包含101與102的行互換。應該是替換,待百度
PBCSPOFT0101 6
PBCSPOFT0101 6
PBCSPOFT0103 8
PB\CSPOFT0104 0
[root@wmsvmpc ~]# echo –e “a\nb\nc\nd\n”|sed –nr ‘H;${x;s/\n//g;p}’
abcd
r:use extended regular expressions in the script,使用功能更強大的正則表達式。
${} 表示處理到文件最后一行時執行{}中的命令,x把之前存入緩存區的數據按先入先出的順序放入模式空間,然后做替換,最后打印