python機器學習生物信息學系列課(博主錄制):
http://dwz.date/b9vw
效應量可以表示兩組樣本平均數的差異
效應量可以用d表示,其公式
觀察實驗組和對照組,效應量越大,兩組平均數越遠,差異越大
效應量不受樣本容量的影響。當樣本容量大得到顯著時,有必要報告效應量大小。
效應量太小,意味着處理即使達到了顯著水平,也缺乏實用價值。
在一般統計分析中,一般我們只報告統計量F或t值,與p-value;實際上這些統計量對數據的描述只是描述了一小部分;傳統的描述還應包括樣本量,樣本均數與標准差;但這些傳統的描述量基本只是對單變量分布的描述,而對兩組變量或處理效應的描述,則用effectsize更加直觀。它在平均數檢驗中表示的是兩組樣本分布的總體的非重疊程度;ES越大,重疊程度越小,效應明顯;ES越小則相反。可以這樣理解,不管你取哪種樣本,ES是作為為一種標准的均數差異的估計,它與當前樣本無關。顯然,傳統的推斷統計量F及p-value只是說明均數差異,但這種差異脫離樣本推廣到不同的抽樣群體,差異究竟有多大,需要用ES來描述。(可以這樣來形容F值與ES值:F值表示的是樣本1與樣本2之間的顯著性;而ES值是表示在樣本1的總體與樣本2的總體中隨便抽取兩個樣本,這種差異顯著性出現的可能性)。
不同檢測中,效應量量化程度不同