R 語言中為了進行數據分析,比如回歸分析,這時候對於數據表格中的factor類型的數據會帶來弊端,比如對因子的每一個數據都進行一次回歸,這樣就顯得很復雜,且違背了我們的初衷,需要把factor轉換為numeric格式。
factor不能直接轉換為numeric格式,它會按照因子的大小順序依次取值1,2,3......
想要正確轉換為對應的數值,可以先把factor轉換為character格式,然后再轉換為numeric,就可以正確顯示數值
> data<- read.csv('breast_cancer.csv'); > class(data$x6); # 這時候為factor [1] "factor" > # 然后轉換factor為numeric > data$x6<-as.numeric(as.character(data$x6)); > class(data$x6); # 這時候為numeric [1] "numeric"
另外需要注意的是,如果你的數據中包含NA值或者其他錯誤類型的值,那么轉換為character類型會產生報錯,需要先刪去所有錯誤類型的值,方法詳見另一篇博客 https://www.cnblogs.com/zhaoke271828/p/12892718.html
------------------------------
ZKe
