一、數學統計函數
概率論是統計學的基礎,R有許多用於處理概率,概率分布以及隨機變量的函數。R對每一個概率分布都有一個簡稱,這個名稱用於識別與分布相聯系的函數。這部分涉及到很多統計學基礎的理論知識,比如隨機試驗,樣本空間,對立與互斥,隨機事件與必然事件,概率密度,概率分布等。
1.四種基本函數
后綴
d + 后綴() 概率密度函數
p + 后綴() 分布函數
q + 后綴() 分布函數的反函數
r + 后綴() 產生相同分布的隨機數
生成均值為15,方差為2,服從正態分布的100個數
2.生成隨機數
生成50個1-100之間的隨機數
生成隨機種子,使下一次生成的隨機數與前一次相同
二、描述性統計函數
1.summary() 和 describe() 函數,對一個數據集進行詳細統計
2.pastecs包中的 stat.desc() 函數,計算種類繁多的描述性統計量
設置norm = T ,則計算一些統計值
3.psych包中的 describe()函數
psych::describe(myvars,trim = 0.1) 去除開頭和結尾10%的部分
4.actuar包中的 aggregate() 函數
使用MASS93數據集
對汽車制造商的產品平均價格的統計
根據產地來分組比較價格
根據產地和制造商進行價格分組
5.doBy包中的 summaryBy() 函數
6.psych包中的describe.by() 函數
三、頻數統計函數
1.對有明顯因子的數據可使用 split() 函數進行分組
對 mtcars 數據中汽車的氣缸數cyl進行統計