R语言导入导出数据


导入数据

三种文件:逗号分隔文件(.csv文件)、制表符分隔文件(.tsv文件)、空格分隔文件(.txt文件)

读取一般文件:

read.table(file="文件名",header=”是否将第一行作为列名,第一行为列名为TRUE,否则为FALSE“,sep="分隔符,如逗号,  制表位\t  空格不用写sep",row.names="行名所在的列")

.csv:read.table(file,header=TRUE,sep=",",row.names="id")

   也可以使用read.csv(),此函数无需设置sep参数,方便一些

.tsv:read.table(file,header=TRUE,sep="\t",row.names="id")

.txt:read.table(file,header=TRUE,row.names="id")

 

读取以.gz结尾的压缩文件

一般在R中使用gzfile()方式读取压缩文件,也可以使用data.table包里的fread()函数,更为方便。

具体方法如下:

先安装并加载data.table包,使用fread()函数读取文件,参数和上面一样。

 

读取excel文件

需要先安装加载readxl包,该包有几个函数可用于读取excel文件,常用的有:read_excel(),read_xls,read_xlsx。各个函数的参数如下:

read_excel(path, sheet = NULL, range = NULL, col_names = TRUE,
  col_types = NULL, na = "", trim_ws = TRUE, skip = 0,
  n_max = Inf, guess_max = min(1000, n_max),
  progress = readxl_progress(), .name_repair = "unique")

read_xls(path, sheet = NULL, range = NULL, col_names = TRUE,
  col_types = NULL, na = "", trim_ws = TRUE, skip = 0,
  n_max = Inf, guess_max = min(1000, n_max),
  progress = readxl_progress(), .name_repair = "unique")

read_xlsx(path, sheet = NULL, range = NULL, col_names = TRUE,
  col_types = NULL, na = "", trim_ws = TRUE, skip = 0,
  n_max = Inf, guess_max = min(1000, n_max),
  progress = readxl_progress(), .name_repair = "unique")

sheet:excel文件中sheet参数,可以为一个字符串、sheet名称、整数,均表示sheet位置。默认为第一个sheet的数据。

range:sheet中单元格的范围,例如range=A1:Q17,也可以指定某一个sheet的位置,例如range="sheet1!A1:Q9"

col_names:第一行是否为列名,TRUE代表使用第一行作为列名,FALSE代表使用默认的名字,或使用字符串或字符串向量表示第一行的名称。

具体参数详情点击https://readxl.tidyverse.org/reference/read_excel.html

 

导出数据:

write.table()

使用readxl包来读取excel文件


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM