參考:什么是卡方檢驗
連續投擲硬幣50次,其中22次為正面,28次為方面,問這枚硬幣是否是正常硬幣?
這是個假設檢驗的問題。
若用卡方檢驗來做,需要先用上面的公式計算卡方值X2,然后查表看卡方值有沒有落入指定區間,即可判定是否應該接受假設。
類似的拋骰子的例子:拋36次,已知各個點數朝上的次數,問是否骰子均衡?
卡方檢驗在機器學習中可以用來篩選特征,判斷某個特征與標簽之間是否存在顯著關聯,相關性有多大等。例如,
>>> from sklearn.datasets import load_iris >>> from sklearn.feature_selection import SelectKBest >>> from sklearn.feature_selection import chi2 #導入卡方檢驗工具 >>> iris = load_iris() >>> X, y = iris.data, iris.target >>> X.shape (150, 4) >>> X_new = SelectKBest(chi2, k=2).fit_transform(X, y) >>> X_new.shape (150, 2)