R語言——根據某一列的重復值,去除該重復值所在的整行


> x
 [1]  3  4  5 11 10  9  8  8  9 10 11 12 13
> duplicated(x)  #判定重復元素,返回邏輯值
 [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE FALSE FALSE

> df #第2行於第4行是相同的,第1行和第3行只有exp相同
   gene     sam exp
1 gene1 sample1  32
2 gene2 sample2  45
3 gene3 sample3  32
4 gene2 sample2  45
> duplicated(df)
[1] FALSE FALSE FALSE  TRUE #第4行是重復值

duplicated()去重使用

#duplicated可以放在[]中,因為是邏輯值
> xu <- x[!duplicated(x)]
> xu
[1]  3  4  5 11 10  9  8 12 13
# 與unique結果是一樣的

# 數據框的去重使用
> dfu <- df[!duplicated(df),]
> dfu
   gene     sam exp
1 gene1 sample1  32
2 gene2 sample2  45
3 gene3 sample3  32


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM