R 基本函數總結


基本
一、數據管理

vector:向量 numeric:數值型向量 logical:邏輯型向量 character;字符型向量 list:列表
data.frame:數據框 c:連接為向量或列表 length:求長度 subset:求子集 seq,from:to,sequence:等差序列
rep:重復 NA:缺失值 NULL:空對象 sort,order,unique,rev:排序 unlist:展平列表 attr,attributes:對象屬性
mode,typeof:對象存儲模式與類型 names:對象的名字屬性


二、字符串處理

character:字符型向量 nchar:字符數 substr:取子串 format,formatC:把對象用格式轉換為字符串 paste,strsplit:連接或拆分
charmatch,pmatch:字符串匹配 grep,sub,gsub:模式匹配與替換  


三、復數

complex,Re,Im,Mod,Arg,Conj:復數函數  


四、因子

factor:因子 codes:因子的編碼 levels:因子的各水平的名字 nlevels:因子的水平個數 cut:把數值型對象分區間轉換為因子
table:交叉頻數表 split:按因子分組 aggregate:計算各數據子集的概括統計量 tapply:對“不規則”數組應用函數
數學
一、計算

+, -, *, /, ^, %%, %/%:四則運算 ceiling,floor,round,signif,trunc,zapsmall:舍入 max,min,pmax,pmin:最大最小值
range:最大值和最小值 sum,prod:向量元素和,積 cumsum,cumprod,cummax,cummin:累加、累乘 sort:排序 approx和approx fun:插值 diff:差分 sign:符號函數  


二、數學函數

abs,sqrt:絕對值,平方根 log, exp, log10, log2:對數與指數函數 sin,cos,tan,asin,acos,atan,atan2:三角函數
sinh,cosh,tanh,asinh,acosh,atanh:雙曲函數
beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:與貝塔函數、伽瑪函數、組合數有關的特殊函數
fft,mvfft,convolve:富利葉變換及卷積 polyroot:多項式求根 poly:正交多項式 spline,splinefun:樣條差值
besselI,besselK,besselJ,besselY,gammaCody:Bessel函數 deriv:簡單表達式的符號微分或算法微分
 
三、數組

array:建立數組 matrix:生成矩陣 data.matrix:把數據框轉換為數值型矩陣 lower.tri:矩陣的下三角部分 mat.or.vec:生成矩陣或向量 t:矩陣轉置
cbind:把列合並為矩陣 rbind:把行合並為矩陣 diag:矩陣對角元素向量或生成對角矩陣 aperm:數組轉置 nrow, ncol:計算數組的行數和列數 dim:對象的維向量
dimnames:對象的維名 row/colnames:行名或列名 %*%:矩陣乘法 crossprod:矩陣交叉乘積(內積) outer:數組外積 kronecker:數組的Kronecker積
apply:對數組的某些維應用函數 tapply:對“不規則”數組應用函數 sweep:計算數組的概括統計量 aggregate:計算數據子集的概括統計量 scale:矩陣標准化
matplot:對矩陣各列繪圖 cor:相關陣或協差陣 Contrast:對照矩陣 row:矩陣的行下標集 col:求列下標集  

 merge函數的聲明:

merge(x, y, by = intersect(names(x), names(y)),
      by.x = by, by.y = by, all = FALSE, all.x = all, all.y = all,
      sort = TRUE, suffixes = c(".x",".y"),
      incomparables = NULL, ...)

x,y:用於合並的兩個數據框

    by,by.x,by.y:指定依據哪些行合並數據框,默認值為相同列名的列.

    all,all.x,all.y:指定x和y的行是否應該全在輸出文件.

    sort:by指定的列是否要排序.

    suffixes:指定除by外相同列名的后綴.

    incomparables:指定by中哪些單元不進行合並.

https://my.oschina.net/u/1791586/blog/337054


四、線性代數

solve:解線性方程組或求逆 eigen:矩陣的特征值分解 svd:矩陣的奇異值分解 backsolve:解上三角或下三角方程組 chol:Choleski分解
qr:矩陣的QR分解 chol2inv:由Choleski分解求逆  


五、邏輯運算

<,>,<=,>=,==,!=:比較運算符 !,&,&&,|,||,xor():邏輯運算符 logical:生成邏輯向量 all,any:邏輯向量都為真或存在真
ifelse():二者擇一 match,%in%:查找 unique:找出互不相同的元素 which:找到真值下標集合 duplicated:找到重復元素

 
六、優化及求根

optimize,uniroot,polyroot:一維優化與求根

七、分布函數
正態分布函數rnorm()
泊松分布函數rpois()
指數分布函數rexp()
gamma分布函數rgamma()
均分分布函數runif()
二項分布函數rbinom()
幾何分布函數rgeom()


程序設計
一、控制結構

if,else,ifelse,switch:分支 for,while,repeat,break,next:循環 apply,lapply,sapply,tapply,sweep:替代循環的函數。

apply,sapply 和 lapply 三種函數對比

1. apply

當需要將特定的函數運用於結構化的數據塊時,結構化的指的是某種矩陣格式。
例如:
m <- matrix(data=cbind(rnorm(30, 0), rnorm(30, 2), rnorm(30, 5)), nrow=30, ncol=3)
apply(m, 2, mean)
#[1] -0.02664418 1.95812458 4.86857792
apply(m, 2, mean) 是將mean函數應用與矩陣 m 的列上,參數 2 指列(1 指行)。
可以自定義函數:
apply(m, 2, function(x) length(x[x<0]))
#[1] 14 1 0
其中,function(x) length(x[x<0]) 即是自定函數。


2. sapply 和 lapply

這兩個函數的功能和用法比較相似,作用於如向量或列表的數據集合上。
舉一個sapply的例子,sapply作用於向量或列表:
sapply(1:3, function(x) x^2)
#[1] 1 4 9

lapply 比較相似,不過lapply的輸出是一個列表而不是向量
lapply(1:3, function(x) x^2)
#[[1]]
#[1] 1
#
#[[2]]
#[1] 4
#
#[[3]]
#[1] 9

sapply和lapply的區別可以通過對函數添加參數來消除:
在sapply函數的參數中添加 simplify=FALSE 即可使函數結果為list格式

sapply(1:3, function(x) x^2, simplify=F)
#[[1]]
#[1] 1
#
#[[2]]
#[1] 4
#
#[[3]]
#[1] 9

在lapply函數外圍在使用unlist函數即可使lapply函數結果為向量格式

unlist(lapply(1:3, function(x) x^2))
#[1] 1 4 9

 

3. 兩種函數功能的相互轉化:

sapply(1:3, function(x) mean(m[,x]))
[1] -0.02664418 1.95812458 4.86857792
sapply(1:3, function(x, y) mean(y[,x]), y=m)
#[1] -0.02664418 1.95812458 4.86857792

這兩個函數功能和 apply(m, 2, function(x) length(x[x<0])) 相同。

 
二、函數

function:函數定義 source:調用文件 call:函數調用 .C,.Fortran:調用C或者Fortran子程序的動態鏈接庫。 Recall:遞歸調用
browser,debug,trace,traceback:程序調試 options:指定系統參數 missing:判斷虛參是否有對應實參 nargs:參數個數 stop:終止函數執行
on.exit:指定退出時執行 eval,expression:表達式計算 system.time:表達式計算計時 invisible:使變量不顯示 menu:選擇菜單(字符列表菜單)
其它與函數有關的還有:delay,delete.response,deparse,do.call,dput,environment ,,formals,format.info,interactive,
is.finite,is.function,is.language,is.recursive ,match.arg,match.call,match.fun,model.extract,name,parse,substitute,sys.parent ,warning,machine


三、輸入輸出

cat,print:顯示對象 sink:輸出轉向到指定文件 dump,save,dput,write:輸出對象 scan,read.table,load,dget:讀入  


四、工作環境

ls,objects:顯示對象列表 rm, remove:刪除對象 q,quit:退出系統 .First,.Last:初始運行函數與退出運行函數。
options:系統選項 ?,help,help.start,apropos:幫助功能 data:列出數據集


統計計算

一、統計分布

每一種分布有四個函數:d――density(密度函數),p――分布函數,q――分位數函數,r――隨機數函數。
比如,正態分布的這四個函數為dnorm,pnorm,qnorm,rnorm。下面我們列出各分布后綴,前面加前綴d、p、q或r就構成函數名:
norm:正態,t:t分布,f:F分布,chisq:卡方(包括非中心) unif:均勻,exp:指數,weibull:威布爾,gamma:伽瑪,beta:貝塔
lnorm:對數正態,logis:邏輯分布,cauchy:柯西, binom:二項分布,geom:幾何分布,hyper:超幾何,nbinom:負二項,pois:泊松 signrank:符號秩,
wilcox:秩和,tukey:學生化極差  


二、簡單統計量

sum, mean, var, sd, min, max, range, median, IQR(四分位間距)等為統計量,sort,order,rank與排序有關,其它還有ave,fivenum,mad,quantile,stem等。


三、統計檢驗

R中已實現的有chisq.test,prop.test,t.test。  


四、多元分析

cor,cov.wt,var:協方差陣及相關陣計算 biplot,biplot.princomp:多元數據biplot圖 cancor:典則相關 princomp:主成分分析 hclust:譜系聚類
kmeans:k-均值聚類 cmdscale:經典多維標度 其它有dist,mahalanobis,cov.rob。  


五、時間序列

ts:時間序列對象 diff:計算差分 time:時間序列的采樣時間 window:時間窗  


六、統計模型

lm,glm,aov:線性模型、廣義線性模型、方差分析


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM