統計學基礎知識(一)---描述統計(Descriptive Statistics)


描述統計(Descriptive Statistics):將數據的信息以表格, 圖形或數值的形式進行匯總。

 

數據類型:分為定量數據(數值型數據)和定性數據(類別型數據)。數值型數據又可以分為連續型和離散型,類別型數據又可以分為有序型和無序型。

 

定性數據:

頻數(frequency):數據出現的次數。

 

相對頻數(relative frequency):數據出現的次數/總次數。

 

百分數(percentage):數據出現的次數/總次數*100%。

 

定量數據:

平均數(mean):總數值除以總數。總體均值---μ;樣本均值---

 

注:這里說的平均數是算術平均數,其他還有加權平均數(weighted mean),幾何平均數(geometric mean)和調和平均數。

 

中位數(median):將所有數據按升序排列,當數據個數是奇數時,中位數就是位於中間的數值,當數據個數是偶數時,中位數就是位於中間的兩個數值的平均值。

 

眾數(mode):出現次數最多的數據。

 

四分位數(quartile):將所有數據按升序排列,然后等分為四部分,處在25%位置上的數值稱為下四分位數Q1,處在50%位置上的數值稱為Q2,處在75%位置上的數值稱為上四分位數Q3。

 

極差(range):最大值-最小值。

 

四分位間距(interquartile range, IQR):第三分位數(Q3)-第一分位數(Q1)。

 

方差(variance):用於度量數據間的變異程度。總體方差---;樣本方差---

 

標准差(standard deviation):方差的平方根。總體標准差---σ;樣本標准差---s。

 

標准值(z-score):某個數值離開平均數有多少個標准差的距離。

 

注:定量數據可以用分箱的方式轉換為定性變量,以此可以再用頻數,百分數表示。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM