R語言csv與txt文本讀入區分（sep參數）

本文轉載自查看原文 2018-07-09 09:20 3706 R語言

R語言csv與txt文本讀入區分

R語言用來處理數據很方便，而處理數據的第一步是把數據讀入內存空間，平時最常用的文本數據儲存格式有兩種；

一種是CSV（逗號分隔符文本）另一種是TXT（Tab分隔符或空格分隔符），有時候讀這兩種文件格式讀入容易混淆。

1，我們讀入數據的時候，一般寫文件名有兩種方式：

（1）將儲存數據的文件所在的目錄設置為工作目錄（setwd（“file path"）),讀文件時只需要寫文件名即可

1 setwd('C:/Data/mydata')
2 data <- read.table('cancer.txt', header=TURE)

（2）不設置工作目錄，讀入文件時使用完整路徑（包括絕對路徑和相對路徑）

1 data <- read.table('C:/Data/mydata/cancer.txt', header=TURE)

（3）我個人偏愛第一種，因為設置好目錄之后我很清楚地知道我當前是在哪個目錄下；這並不意味這第二種就沒有意義；

當我們一開始就在系統環境下切換到某個確切的目錄下（DOS和Linux都使用cd命令），這種情況下使用第二種方法也同樣

只要寫文件名即可。總而言之，切換目錄是必須的，區別在於你是交給系統（通過cd命令切換），setwd函數還是指定確切的路徑來完成。

2，使用read.table函數讀入

（1）讀入txt文件

1 data <- read.table('cancer.txt', header=TRUE)

header=TRUE代表讀入數據時將第一行作為列名（若是FALSE則相反，不使用文件中第一行作為列名），也可以簡寫問header=T(或是header=F)

不用指定sep參數，因為read.txt函數默認參數sep='\t'。當然願意的話你也可以指定，那樣的話會顯得有點多余

（2）讀入csv文件

1 data <- read.txt('cancer.csv', header=TURE, sep=',')

必須指定sep=','不指定不會報錯但是會出現你讀入的數據只有一列的情況

3，使用read.csv函數讀入

（1）讀入txt文件

1 data <- read.csv('cancer.txt', header=TURE, sep='\t')

必須指定sep參數

（2）讀入csv文件

1 data <- read.csv('cancer.csv', header=TURE)

不強制指定sep參數，因為默認sep=','

4，我推薦使用read.table函數讀入txt文件，read.csv函數讀入csv文件；可以少寫幾個字為啥不偷點懶呢？

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 R語言：讀入txt文件中文文本出現亂碼解決方案 R語言︱文件讀入、讀出一些方法羅列（批量xlsx文件、數據庫、文本txt、文件夾） py3 讀入和寫入csv，txt文件 R語言學習——R讀取txt、csv、xls和xlsx格式文件 R語言讀入excel表格(xlsx/readxl) java 讀取CSV數據並寫入txt文本 R語言報錯：Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec, : n行沒有x元素 R語言寫入txt文件 R語言如何讀取.csv文件 pandas df.to_csv 可保存為 txt 類型 index 設置索引 header 列名 sep 使用什么進行分隔