變量類型|數據類型|統計特征|


生物統計學-描述統計

首先必須明確:生物實驗的總體是無窮個,而研究人員做生物實驗得到的數據永遠是樣本。因為不同類別的變量指向不同的統計方法,所以必須首先明確變量類型。

變量類型有:

 

 

 

 

其中,類別變量的本質是字符串,數值變量的本質是數值型,所以,雖然有些類別變量表現為數字,但將它們做運算的結果是沒有任何意義的。

數據類型的分類依據有:

 

 

 

 

獲取方式(觀測數據;實驗數據)、衡量尺度(數值型數據;順序數據;分類數據)、屬性(定性數據;定量數據)、數學性質(離散數據;連續數據)。。。。。:

其中,二次數據需注意經過何種處理,因為這樣才能知道該數據是否適合本研究或者該數據對於本研究是否過時,這是數據篩選的一種。

 

得到了有效數據之后,將用表與圖將這些數據的信息表現出來,關鍵在於用最簡潔的表現方法表現出最大的信息量。

為了進一步分析數據,統計學上規定了一些術語:

隨機變量是每次實驗都會發生改變的數據,它不是某些數字,而是一種分布;樣本容量是每次實驗得到的數據個數(eg,一次實驗測1000A的濃度,樣本容量為1000

樣本容量是n,有m次試驗

第一次試驗的數據中的第一個測量量,其真實數字將大寫X改為小寫x表示,並稱為測量值。

:第一次試驗的數據中的第二個測量量

:第一次試驗的數據中的第三個測量量

第一次試驗的數據中的第n個測量量

第一次試驗中所有n個測量量的平均值

參數僅是對於總體而言的真值,而統計量完全由樣本中的隨機變量計算出來與參數無關,所以只能用統計量來進行參數估計和假設檢驗,而不能確定真實的參數值,所以統計量也是隨機變量。具體而言,就是每次實驗都會得到一個統計量的值作為參數的估計值,有可能回回都不一樣。

為了准確描述統計量的特征,研究人員通過對統計量的數學運算,提取了(或者也放大了)統計量的某些特征。

想要得到統計量的集中區域特征,可以使用:算術平均數,但易受極端值影響,加權平均數可以減輕極端值的影響;中位數需要排序得到,但是不宜進行代數運算和統計推斷,因為統計推斷也需要能運算的值。眾數對觀察值個數和值的變化不敏感,所以它與其他統計量組合使用;幾何平均數;調和平均數

要想評估統計量的分散長度,可以使用:極差明確了數據范圍;方差是所有數據偏離均值的程度的均值,放大了微小的分散程度,便有判斷;樣本方差;總體方差;標准差;變異系數可以用於方差相同均值不同的數

為了得到統計量的不同位置的值,可以使用:平均數&眾數可以得到中心位置的值;四分位數

為了從數值角度描述分布形態(而非圖形角度),可以使用:峰度表現正態分布“山峰”的尖銳程度(eg>0表明山峰比標准正態分布尖銳)

為了從數值角度描述偏離程度(而非圖形角度),可以使用:偏度表現正態分布“山峰”的偏離程度(eg左,表明均值在峰值的左邊)

有了描述統計,才能看出了其分布,才能依據分布推斷總體,而不是用單一數值去推斷總體

再次強調實驗過程:收集數據主要依靠物理實驗,利用描述統計工具完成整理階段(數據實驗),利用預測統計工具完成分析階段(實驗),最后的生物學解釋取決於對生物學課題的熟悉程度。在實驗開始之前拿小樣本做估計是必要的,即便是小樣本也或多或少反映了一些基本情況。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM