推斷(inference)和預測(prediction)


上二年級的大兒子一直在喝無乳糖牛奶,最近讓他嘗試喝正常牛奶,看看反應如何。三天過后,兒子說,好像沒反應,我可不可以說我不對乳糖敏感了。
我說,呃,這個問題不簡單啊。你知道嗎,這在統計學上叫推斷。
兒子很好學,居然叫我解釋什么叫推斷。
 
好吧,那我就來賣弄一下。
 
老早之前,聽機器學習的一個podcast,是總結前一年機器學習領域發生什么事情,最后一段P主說: 我們已經總結了這一年,那我們來預測(predict)一下明年吧,不過我覺得說predict不是那么准確,應該是做一下inference比較對。
 
Hmm,我們做機器學習的一般來說,說來說去就是做預測,inference是個什么鬼。
 
推斷inference是統計學上的概念。簡單的理解,就是從少量的樣本的統計結果,得出對總體的結論。
 
比如說有美國總統大選,有調查公司就會對一部分人進行問卷調查,問他們會選誰,然后從根據這個結果,推斷出這屆總統會是誰。統計學是基於概率論的,當給出結果的時候,會給出confident interval,就是可信度。這個推斷做得好不好和樣本的選取關系非常大,一句話樣本必須有代表性。
 
聽上去,和機器學習貌似很像,都差不多是預測個東西嘛。其實還是不一樣的,什么才叫預測呢。舉一個例子,就看出區別了。
 
比如說我們現在也知道一些樣本,知道他們的年齡,性別,工作,收入,居住區域,會選誰。然后,我們從總體(population)中隨便找出一個人,並且知道他的年齡,性別,工作,收入,居住區域,我們想知道他會選誰,現在做的就是預測predict。
 
預測,機器學習的定義就是,根據給定的樣本,訓練模型,用來預測未知的樣本。
 
當然機器學習和統計學並不是分開的兩學科。很多機器學習的模型是基於統計學的。比如說非常popular的貝葉斯統計模型。對於被觀察事件,根據先驗知識,建立分布模型,根據觀察到的樣本得到后驗分布模型,然后再用來預測未知樣本的概率分布,作出概率最大的預測,並給出可信度。和機器學習中的或回歸或分類模型一起,可謂條條大路通羅馬。但其實也有有交叉的,比如說最大熵算法其實是建立在以概率論為基礎的信息論上的。
 
統計學是非常有意思的數學。 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM