文本分類學習 (四) 特征選擇之卡方檢驗
前言: 上一篇提到了特征提取,或者叫做降維。在文本分類中,特征提取算法的優劣對於文本分類的結果具有非常大的影響。 所以選擇效果好的特征提取算法是文本分類前中很重要的步驟。於是這篇就對卡方檢驗做一個介 ...
前言: 上一篇提到了特征提取,或者叫做降維。在文本分類中,特征提取算法的優劣對於文本分類的結果具有非常大的影響。 所以選擇效果好的特征提取算法是文本分類前中很重要的步驟。於是這篇就對卡方檢驗做一個介 ...
來源:《深入淺出統計學》 ...
前言: 上一篇比較詳細的介紹了卡方檢驗和卡方分布。這篇我們就實際操刀,找到一些訓練集,正所謂紙上得來終覺淺,絕知此事要躬行。然而我在躬行的時候,發現了卡方檢驗對於文本分類來說應該把公式再變形一般,那 ...
卡方分布—chi-square distribution, χ2-distribution: 若k個獨立的隨機變量Z1, Z2,..., Zk 滿足標准正態分布 N(0,1) , 則這k個隨機變量的 ...