R語言--高級數據管理（數值和字符處理函數） - 碼上歡樂

相關內容簡體繁體

R語言--高級數據管理（數值和字符處理函數）

本文轉載自查看原文 2021-07-04 13:36 190 R語言/ R語言--高級數據管理（數值和字符處理函數）

1 高級數據管理

1.1 數值和字符處理函數

（1）數學函數

絕對值函數：abs()

取整函數：floor()，取不大於這個數的整數

取對數函數：log()，log10()

四舍五入函數：round()

（2）統計函數

均值函數：mean()

方差函數：var()

標准差函數：sd()

分位數函數：quantile()

x<-quantile(c(1,2,3,4,5,6,7,8,9,10),c(0.2,0.8))

解釋：c(0.2,0.8)求這些向量的20%的分位數和80%的分位數

（3）概率函數

beta分布：beta

正態分布：norm

柯西分布：cauchy

密度函數：d=

分布函數：p=

分位數函數：q=

生成隨機數：r=

正太密度函數使用：

x<-pretty(c(-3,3),30)

解釋：pretty是最優分等點，使分出來的數字盡量不會太多小數點，c(-3,3)設置了數的范圍為-3到3，30分為30個等份

y<-dnorm(x) #x的密度正太分布函數

plot(x,y,type = "l")

正太分布函數：求1.96這個值在標准正太分布曲線下對應的面積使多少

正太分位數函數：求均值為500，標准差為100的正太分布，它的90%分位點對應的x是多少

生成隨機數：生成10個均值為5，標准差為5的隨機數

例子：

library("MASS")

options(digits = 3)

set.seed(123)

mean<-c(230.7,146.7,3.6)

sigma<-matrix(c(15260.8,6721.2,-47.1,6721.2,4700.9,-16.5,-47.1,-16.5,0.3),nrow=3,ncol=3)

mydata<-mvrnorm(50000,mean,sigma) #生成5萬個均值是mean，協方差是sigma的矩陣

mydata<-as.data.frame(mydata) #把矩陣轉成數據框

names(mydata)<-c("y","x1","x2") #對數據框取名字

（4）字符處理函數

計算字符串長度：nchar()

截取字符串長度：substr()

（5）其他實用函數

長度函數：length（）

生成一個序列的函數：seq()

重復函數：rep()

（6）將函數用於矩陣和數據框

四舍五入函數：round()

隨機數矩陣：matrix() ,runif()

隨機生成一個3行4列的12個數字的矩陣

對矩陣求矩陣（整體）：mean()

矩陣按行求均值：apply() ,參數設置為1

矩陣按列求均值：apply() ,參數設置為2

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 R語言實戰學習筆記-高級數據管理 R語言常用數據管理 R語言處理缺失數據的高級方法 R語言-字符串處理函數【R筆記】R語言中的字符串處理函數 R語言實戰（十）處理缺失數據的高級方法 R語言--基本數據管理（變量、缺失值、日期值、數據類型轉換、數據框） R語言中的字符串處理函數【R語言】常用的字符串處理函數【待更新】 Docker數據管理(五)

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM