linux：刪除指定列重復的行

本文轉載自查看原文 2021-12-06 21:42 847 linux

現在有文件file.txt, 如下所示：

header1 header2
chr10_10000018 chr11
chr10_10000018 chr12
chr10_100000625 chr10
chr10_100000645 chr11
chr10_100001867 chr11

可以看到，第一列的chr10_10000018存在重復的值，分別位於第一行和第二行，現在只希望保留第一行，變成如下文件file1.txt所示：

header1 header2
chr10_10000018 chr11
chr10_100000625 chr10
chr10_100000645 chr11
chr10_100001867 chr11

則可以用命令：

tail -n +2 file.txt | sort -k1,1 -V | sort -uk1,1 -V > file1.txt

tail -n +2 指的是header不參與排序；

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pandas刪除指定的行,和列 shell 根據指定列進行去除重復行 Pandas 刪除指定列中為NaN的行 Pandas常用操作 - 刪除指定行/指定列 linux用命令刪除重復行 df.drop_duplicates()返回刪除重復行（或者列）的DataFrame 刪除DataTable重復列，只針對刪除其中的一列重復的行 linux shell實現將指定行重復指定的次數 pandas Dataframe刪除指定列中有空值的行 pandas刪除指定列中有空值的行