R語言刪除不規范的值(或NA)


 

  在使用R語言處理表格時(xlsx, csv),有時里面含有缺失值,或者不規范的數值,比如下圖有許多的問號“?”,為了便於處理數據,這些都應該整行地刪掉。

 

  為了刪掉那些包含"?"的行,需要先找到那些行,方法如下,通過 which(邏輯表達式) 函數找到對應行標

> data<- read.csv('breast_cancer.csv');
> which(data$x6=="?")
 [1]  24  41 140 146 159 165 236 250 276 293 295 298 316 322 412 618

  然后直接進行切片操作就得到了對應的行,然而我們找到的只是包含"?"的行,為了便於直接調用R語言中刪除包含NA行的函數,我們可以選擇先把"?"轉換為NA

data$x6[which(data$x6=="?")]=NA;

    然后直接調用如下函數

data=na.omit(data);

  就完成了

 

-----------------------------------

ZKe


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM