統計學中最常見的幾種概率分布分別是正態分布(normal distribution),t分布(t distribution),F分布(F distribution)和卡方分布(χ2 distribut ...
統計學中最常見的幾種概率分布分別是正態分布(normal distribution),t分布(t distribution),F分布(F distribution)和卡方分布(χ2 distribut ...
Pearson's r,稱為皮爾遜相關系數(Pearson correlation coefficient),用來反映兩個隨機變量之間的線性相關程度。 用於總體(population)時記作ρ ...
做完一個假設檢驗之后,如果結果具有統計顯著性,那么還需要繼續計算其效應量,如果結果不具有統計顯著性,並且還需要繼續進行決策的話,那么需要計算功效。 功效(power):正確拒絕原假設的概率,記 ...
今天聽課聽到這樣一個結論:如果假設檢驗的樣本量很大,那么顯著性水平α應該設得小一點。 為什么呢?我沒想通,於是去網上試圖查找答案。結果發現網上很多人還在糾結:如果假設檢驗的樣本量很大,那么會使 ...
在《如何計算假設檢驗的功效(power)和效應量(effect size)?》一文中,我們講述了如何根據顯著性水平α,效應量和樣本容量n,計算功效,以及如何根據顯著性水平α,功效和樣本容量n,計算效應 ...
z檢驗: 計算臨界值:scipy.stats.norm.ppf(level_of_confidence) 計算p值:scipy.stats.norm.sf(abs(z_score)) 或 1-sc ...
切比雪夫定理(Chebyshev's theorem):適用於任何數據集,而不論數據的分布情況如何。 與平均數的距離在z個標准差之內的數值所占的比例至少為(1-1/z2),其中z是大於1的任意 ...
假設檢驗的定義 假設檢驗:先對總體參數提出某種假設,然后利用樣本數據判斷假設是否成立。在邏輯上,假設檢驗采用了反證法,即先提出假設,再通過適當的統計學方法證明這個假設基本不可能是真的。(說“基本”是 ...
中心極限定理:每次從總體中抽取容量為n的簡單隨機樣本,這樣抽取很多次后,如果樣本容量很大,樣本均值的抽樣分布近似服從正態分布(期望為 ,標准差為 )。 (注:總體數據需獨立同分布) 那么樣 ...
這里用文氏圖(Venn diagram)來推導一下貝葉斯定理。 假設A和B為兩個不相互獨立的事件。 交集(intersection): 上圖紅色部分即為事件A和事件B的交集。 ...