在使用R語言處理表格時(xlsx, csv),有時里面含有缺失值,或者不規范的數值,比如下圖有許多的問號“?”,為了便於處理數據,這些都應該整行地刪掉。
為了刪掉那些包含"?"的行,需要先找到那些行,方法如下,通過 which(邏輯表達式) 函數找到對應行標
> data<- read.csv('breast_cancer.csv'); > which(data$x6=="?") [1] 24 41 140 146 159 165 236 250 276 293 295 298 316 322 412 618
然后直接進行切片操作就得到了對應的行,然而我們找到的只是包含"?"的行,為了便於直接調用R語言中刪除包含NA行的函數,我們可以選擇先把"?"轉換為NA
data$x6[which(data$x6=="?")]=NA;
然后直接調用如下函數
data=na.omit(data);
就完成了
-----------------------------------
ZKe