R語言csv與txt文本讀入區分(sep參數)


R語言csv與txt文本讀入區分

R語言用來處理數據很方便,而處理數據的第一步是把數據讀入內存空間,平時最常用的文本數據儲存格式有兩種;

一種是CSV(逗號分隔符文本)另一種是TXT(Tab分隔符或空格分隔符),有時候讀這兩種文件格式讀入容易混淆。

1,我們讀入數據的時候,一般寫文件名有兩種方式:

(1)將儲存數據的文件所在的目錄設置為工作目錄(setwd(“file path")),讀文件時只需要寫文件名即可

1 setwd('C:/Data/mydata')
2 data <- read.table('cancer.txt', header=TURE)

 

(2)不設置工作目錄,讀入文件時使用完整路徑(包括絕對路徑和相對路徑)

1 data <- read.table('C:/Data/mydata/cancer.txt', header=TURE)

 

(3)我個人偏愛第一種,因為設置好目錄之后我很清楚地知道我當前是在哪個目錄下;這並不意味這第二種就沒有意義;

當我們一開始就在系統環境下切換到某個確切的目錄下(DOS和Linux都使用cd命令),這種情況下使用第二種方法也同樣

只要寫文件名即可。總而言之,切換目錄是必須的,區別在於你是交給系統(通過cd命令切換),setwd函數還是指定確切的路徑來完成。

2,使用read.table函數讀入

(1)讀入txt文件

1 data <- read.table('cancer.txt', header=TRUE)

header=TRUE代表讀入數據時將第一行作為列名(若是FALSE則相反,不使用文件中第一行作為列名),也可以簡寫問header=T(或是header=F)

不用指定sep參數,因為read.txt函數默認參數sep='\t'。當然願意的話你也可以指定,那樣的話會顯得有點多余

(2)讀入csv文件

1 data <- read.txt('cancer.csv', header=TURE, sep=',')

必須指定sep=','不指定不會報錯但是會出現你讀入的數據只有一列的情況

3,使用read.csv函數讀入

(1)讀入txt文件

1 data <- read.csv('cancer.txt', header=TURE, sep='\t')

必須指定sep參數

(2)讀入csv文件

1 data <- read.csv('cancer.csv', header=TURE)

不強制指定sep參數,因為默認sep=','

4,我推薦使用read.table函數讀入txt文件,read.csv函數讀入csv文件;可以少寫幾個字為啥不偷點懶呢?


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM