linux：删除指定列重复的行

本文转载自查看原文 2021-12-06 21:42 847 linux

现在有文件file.txt, 如下所示：

header1 header2
chr10_10000018 chr11
chr10_10000018 chr12
chr10_100000625 chr10
chr10_100000645 chr11
chr10_100001867 chr11

可以看到，第一列的chr10_10000018存在重复的值，分别位于第一行和第二行，现在只希望保留第一行，变成如下文件file1.txt所示：

header1 header2
chr10_10000018 chr11
chr10_100000625 chr10
chr10_100000645 chr11
chr10_100001867 chr11

则可以用命令：

tail -n +2 file.txt | sort -k1,1 -V | sort -uk1,1 -V > file1.txt

tail -n +2 指的是header不参与排序；

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 pandas删除指定的行,和列 shell 根据指定列进行去除重复行 Pandas 删除指定列中为NaN的行 Pandas常用操作 - 删除指定行/指定列 linux用命令删除重复行 df.drop_duplicates()返回删除重复行（或者列）的DataFrame 删除DataTable重复列，只针对删除其中的一列重复的行 linux shell实现将指定行重复指定的次数 pandas Dataframe删除指定列中有空值的行 pandas删除指定列中有空值的行