R语言导入导出数据

本文转载自查看原文 2022-01-05 11:23 913 数据分析

导入数据

三种文件：逗号分隔文件（.csv文件）、制表符分隔文件（.tsv文件）、空格分隔文件（.txt文件）

读取一般文件：

read.table(file="文件名",header=”是否将第一行作为列名，第一行为列名为TRUE，否则为FALSE“,sep="分隔符，如逗号, 制表位\t 空格不用写sep",row.names="行名所在的列")

.csv：read.table(file,header=TRUE,sep=",",row.names="id")

　　　也可以使用read.csv()，此函数无需设置sep参数，方便一些

.tsv：read.table(file,header=TRUE,sep="\t",row.names="id")

.txt：read.table(file,header=TRUE,row.names="id")

读取以.gz结尾的压缩文件

一般在R中使用gzfile()方式读取压缩文件，也可以使用data.table包里的fread()函数，更为方便。

具体方法如下：

先安装并加载data.table包，使用fread()函数读取文件，参数和上面一样。

读取excel文件

需要先安装加载readxl包，该包有几个函数可用于读取excel文件，常用的有：read_excel()，read_xls，read_xlsx。各个函数的参数如下：

read_excel(path, sheet = NULL, range = NULL, col_names = TRUE,
  col_types = NULL, na = "", trim_ws = TRUE, skip = 0,
  n_max = Inf, guess_max = min(1000, n_max),
  progress = readxl_progress(), .name_repair = "unique")

read_xls(path, sheet = NULL, range = NULL, col_names = TRUE,
  col_types = NULL, na = "", trim_ws = TRUE, skip = 0,
  n_max = Inf, guess_max = min(1000, n_max),
  progress = readxl_progress(), .name_repair = "unique")

read_xlsx(path, sheet = NULL, range = NULL, col_names = TRUE,
  col_types = NULL, na = "", trim_ws = TRUE, skip = 0,
  n_max = Inf, guess_max = min(1000, n_max),
  progress = readxl_progress(), .name_repair = "unique")

sheet：excel文件中sheet参数，可以为一个字符串、sheet名称、整数，均表示sheet位置。默认为第一个sheet的数据。

range：sheet中单元格的范围，例如range=A1:Q17，也可以指定某一个sheet的位置，例如range="sheet1!A1:Q9"

col_names：第一行是否为列名，TRUE代表使用第一行作为列名，FALSE代表使用默认的名字，或使用字符串或字符串向量表示第一行的名称。

具体参数详情点击https://readxl.tidyverse.org/reference/read_excel.html

导出数据：

write.table()

使用`readxl`包来读取excel文件

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 R语言XML格式数据导入与处理 R语言--list列表详解与数据导入方法 oracle11g-R2数据库的逻辑备份（数据泵的导入导出） MySQL 之导出导入数据 elasticdump 数据导入导出 vertica导出导入数据 Oracle数据的导入与导出六、MySQL的数据导入与导出 Oracle数据的的导入与导出 Oracle 导出导入数据