linux系统中comm命令的用法


linux中comm命令用于提取两列数据中的唯一项、交集、并集等。

1、测试数据

root@PC1:/home/test/test# ls
a.txt  b.txt
root@PC1:/home/test/test# cat a.txt
w
s
g
d
w
a
root@PC1:/home/test/test# cat b.txt
d
a
e
d
t
c

 

2、对数据去重复

root@PC1:/home/test/test# cat a.txt
w
s
g
d
w
a
root@PC1:/home/test/test# sort -u a.txt > a && mv a a.txt
root@PC1:/home/test/test# cat a.txt
a
d
g
s
w
root@PC1:/home/test/test# cat b.txt
d
a
e
d
t
c
root@PC1:/home/test/test# sort -u b.txt > a && mv a b.txt
root@PC1:/home/test/test# cat b.txt
a
c
d
e
t

 

3、测试使用

root@PC1:/home/test/test# cat a.txt
a
d
g
s
w
root@PC1:/home/test/test# cat b.txt
a
c
d
e
t
root@PC1:/home/test/test# comm a.txt b.txt
                a
        c
                d
        e
g
s
        t
w

第一列是a.txt中唯一的项, 第二列是b.txt中唯一的项, 第三列是a.txt和b.txt中共有的项

 

4、只保留a.txt中唯一的项、 或者b.txt中唯一的项、或者两者交集

root@PC1:/home/test/test# cat a.txt
a
d
g
s
w
root@PC1:/home/test/test# cat b.txt
a
c
d
e
t
root@PC1:/home/test/test# comm a.txt b.txt
                a
        c
                d
        e
g
s
        t
w
root@PC1:/home/test/test# comm a.txt b.txt -2 -3
g
s
w
root@PC1:/home/test/test# comm a.txt b.txt -1 -3
c
e
t
root@PC1:/home/test/test# comm a.txt b.txt -1 -2
a
d

 

5、取两者并集

root@PC1:/home/test/test# cat a.txt
a
d
g
s
w
root@PC1:/home/test/test# cat b.txt
a
c
d
e
t
root@PC1:/home/test/test# comm a.txt b.txt
                a
        c
                d
        e
g
s
        t
w
root@PC1:/home/test/test# comm a.txt b.txt  | sed 's/^[\t]\+//g'
a
c
d
e
g
s
t
w

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM