讀取csv格式數據
數據來源是西南財經大學 司亞卿 老師的課程作業
方法一:read.csv()函數
1 file.choose() 2 read.csv("C:\\Users\\Administrator\\Desktop\\Astocks.csv", 3 head=T,sep=',',nrows = 5,stringsAsFactors = FALSE)
file.choose():讀入該文件,這樣我們知道該文件的具體路徑。
file參數: 路徑和文件名,windows下用的是反斜杠\\
head=T: 是首行問題,T表明文件有標題,將文件中的第一行作為列名。若head=F,則原來文件沒有
標題,增加一行V1,V2,...作為文件的第一行,即作為列名。read.csv()函數默認為head=T。
sep=“,”: 分隔符問題,這里分隔符的選擇會影響輸入的被引用的字符串。
nrows=200: 行數問題,表明讀取該文件的前200行。
stringsAsFactors = FALSE : 字符型數據讀入時自動轉換為因子,防止轉換為因子,
令參數stringsAsFactors = FALSE, 防止導入的數據任何因子的轉換。
還有一個參數:fileEncoding='utf-8',在win下一般不用設置,但是在Linux下若出現亂碼問題,基本上就是要加上這個參數。就這個文件而言加上這個會報錯,應該是fileEncoding='GBK',這樣才能正常運行。這里涉及到字符集的問題。
方法二:read.table()函數
1 a<-read.table('C:\\Users\\Administrator\\Desktop\\Astocks.csv', 2 head=T,sep=',',nrows = 5,stringsAsFactors = FALSE ) 3 a
1 a[1:3,1:3]
結果
切片:選取行數和列數(選取1到3行和1到3列)
也可以進行這樣讀取:
1 a<-read.table(file.choose(),header = T,sep = ',',nrows = 5) 2 a
結果: