數據處理不等式：Data Processing Inequality

本文轉載自查看原文 2017-11-02 11:48 1409 Machine Learning

我是在差分隱私下看到的，新解決方案的可用性肯定小於原有解決方案的可用性，也就是說信息的后續處理只會降低所擁有的信息量。

那么如果這么說的話為什么還要做特征工程呢，這是因為該不等式有一個巨大的前提就是數據處理方法無比的強大，比如很多的樣本要分類，我們做特征提取后，SVM效果很好，但是如果用DNN之類的CNN、AuToEncoder，那么效果反而不如原來特征。這樣就能理解了，DNN提取能力更強，那么原始就要有更多的信息，在新特征下無論怎么提取，信息就那么多。

信息量越多越好么？肯定不是，否則為什么PCA要做降噪和去冗余呢？我們的目的是有效的信息最大化。

另外一種理解就是從互信息不為0（信息損失）來解釋。

從而

那么如何在處理過程中不丟失有效信息呢？這時候就需要數學上的充分統計量，也就是g是y的充分統計量。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 集合不等式之Bonferroni inequality 馬爾科夫不等式：Markov Inequality 凸函數與簡森不等式（Jensen's inequality） Schwarz inequality（施瓦茨不等式）一個簡潔證明的思路分析 Jensen 不等式不等式筆記 Jensen不等式基本不等式 Jensen不等式馬爾可夫不等式與切比雪夫不等式