R語言實戰(第一章+第二章:創建數據集)


第一章:R語言介紹

1. 使用函數getwd()來查看當前的工作目錄,或使用函數setwd()設定當前的工作目錄。

 

 

 getwd()

setwd(“C:/x/y”)

2.包是R函數、數據、預編譯代碼以一種定義完善的格式組成的集合。計算機上存儲包的目錄
稱為庫(library)。函數.libPaths()能夠顯示庫所在的位置, 函數library()則可以顯示庫中
有哪些包。
包的安裝install.packages()
包的載入  library()
第二章:創建數據集
 
1.向量是用於存儲數值型、字符型或邏輯型數據的一維數組。
2.矩陣是一個二維數組,只是每個元素都擁有相同的模式(數值型、字符型或邏輯型)。可通過函數matrix創建矩陣。一般使用格式為:
mymatrix<-matrix(vector,nrow=5,ncol=6,byrow=TRUE)
mymatrix<-matrix(c(1:30),nrow=5,ncol=6,byrow=TRUE)
其中vector包含了矩陣的元素,nrow和ncol用以指定行和列的維數 選項byrow則表明矩陣應當按行填充(byrow=TRUE)還是按
列填充(byrow=FALSE)

我們可以使用下標和方括號來選擇矩陣中的行、列或元素。X[i,]指矩陣X中的第i 行,X[,j]
指第j 列,X[i, j]指第i 行第j 個元素。選擇多行或多列時,下標i 和j 可為數值型向量
3.數組(array)與矩陣類似,但是維度可以大於2。

myarray<-array(vector,dimensions,dimnames) 

myarray<-array(c(1:24),c(2,3,4),dimnames=list(dim1,dim2,dim3))

vector包含了數組中的數據,dimensions是一個數值型向量,給出了各個維度下標的最大值,而dimnames是可選的、各維度名稱標簽的列表。
dim1<-c("row1","row2")
dim2<-c("col1","col2","col3","col4")
dim3<-c("w1","w2","w3")
x<-array(1:24,c(2,4,3),dimnames=list(dim1,dim2,dim3))
x

 

 4.數據框

每一列數據的模式必須唯一,可以將多個模式的不同列放到一起組成數據框。

patientID<-c(1,2,3,4)

age<-c(25,34,28,34)

diabetes<-c("Poor","Improved","Excellent","Wonderful")

patientdata<-data.frame(patientID,age,diabetes)

記號$被用來選取一個給定數據框中的某個特定變量。如:列聯表table(patientdata$diabetes,patientdata$age)

 attach()、detach()和with()
函數attach()可將數據框添加到R的搜索路徑中,函數detach()將數據框從搜索路徑中移除。
attach(mtcars)
plot(mpg,wt)
detach(mtcars)
5.因子
類別(名義型)變量和有序類別(有序型)變量在R中稱為因子(factor)
函數factor()以一個整數向量的形式存儲類別值,整數的取值范圍是[1... k ](其中k 是名義型變量中唯一值的個數),同時一個由字符串(原始值)組成的內部向量將映射到這些整數上。
6.列表
列表就是一些對象(或成分,component)的有序集合。
列表中可能是若干向量、矩陣、數據框,甚至其他列表的組合。
可以使用函數list()創建列表:其中的對象可以是目前為止講到的任何結構。
mylist<-list(object1,object2)
還可以為列表中的對象命名
 mylist<-list(name1=object1,name2=object2)
 
7.數據的輸入
①使用鍵盤輸入數據
mydata<-data.frame(age=numeric(0),gender=character(0),weight=numeric(0))
mydata<-edit(mydata)
②分隔符的文本文件導入數據
getwd()
setwd()
x<-read.table("mtcars.csv",header=TRUE,sep="\t")
導入Excel數據
讀取一個Excel文件的最好方式,就是在Excel中將其導出為一個逗號分隔文件(csv),並使用前文描述的方式將其導入R中
install.packages("RODBC")
library(RODBC)
read.xlsx()

8.實用的數據對象處理函數

length(object)

顯示對象中元素/成分的數量
dim(object)
顯示某個對象的維度
str(object)
顯示某個對象的結構
class(object)
顯示某個對象的類或類型
mode(object)
顯示某個對象的模式
names(object)
顯示某對象中各成分的名稱
c(object, object,…)
將對象合並入一個向量
cbind(object, object, …)
按列合並對象
rbind(object, object, …)
按行合並對象
Object
輸出某個對象
head(object)
列出某個對象的開始部分
tail(object)
列出某個對象的最后部分
ls()
顯示當前的對象列表
rm(object, object, …)
刪除一個或更多個對象。語句rm(list = ls())
將刪除當前工作環境中的幾乎所有對象*
newobject <- edit(object)
編輯對象並另存為newobject
fix(object)
直接編輯對象
 
 
 
 
 
 
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM