标签【Statistics】 - 码上欢乐

统计学中最常见的几种概率分布分别是正态分布（normal distribution），t分布（t distribution），F分布（F distribution）和卡方分布（χ2 distribut ...

Pearson's r，称为皮尔逊相关系数（Pearson correlation coefficient），用来反映两个随机变量之间的线性相关程度。用于总体（population）时记作ρ ...

做完一个假设检验之后，如果结果具有统计显著性，那么还需要继续计算其效应量，如果结果不具有统计显著性，并且还需要继续进行决策的话，那么需要计算功效。功效（power）：正确拒绝原假设的概率，记 ...

今天听课听到这样一个结论：如果假设检验的样本量很大，那么显著性水平α应该设得小一点。为什么呢？我没想通，于是去网上试图查找答案。结果发现网上很多人还在纠结：如果假设检验的样本量很大，那么会使 ...

在《如何计算假设检验的功效（power）和效应量（effect size）？》一文中，我们讲述了如何根据显著性水平α，效应量和样本容量n，计算功效，以及如何根据显著性水平α，功效和样本容量n，计算效应 ...

z检验：计算临界值：scipy.stats.norm.ppf(level_of_confidence) 计算p值：scipy.stats.norm.sf(abs(z_score)) 或 1-sc ...

切比雪夫定理（Chebyshev's theorem）：适用于任何数据集，而不论数据的分布情况如何。与平均数的距离在z个标准差之内的数值所占的比例至少为(1-1/z2)，其中z是大于1的任意 ...

假设检验（Hypothesis Testing）

假设检验的定义假设检验：先对总体参数提出某种假设，然后利用样本数据判断假设是否成立。在逻辑上，假设检验采用了反证法，即先提出假设，再通过适当的统计学方法证明这个假设基本不可能是真的。（说“基本”是 ...

中心极限定理：每次从总体中抽取容量为n的简单随机样本，这样抽取很多次后，如果样本容量很大，样本均值的抽样分布近似服从正态分布（期望为，标准差为）。（注：总体数据需独立同分布）那么样 ...

贝叶斯定理推导（Bayes's Theorem）

这里用文氏图（Venn diagram）来推导一下贝叶斯定理。假设A和B为两个不相互独立的事件。交集（intersection）：上图红色部分即为事件A和事件B的交集。 ...