微積分和概率論
作者:櫻花豬
摘要:
本文為七月算法(julyedu.com)12月機器學習第一次課在線筆記。本次課以機器學習的觀點來看待曾經學過的數學問題,為未來的做機器學習的公式推導做理論基礎。主要內容包括高等數學和概率論部分內容。課程通過簡單的數學知識串講,喚起封存已久的記憶。
引言:
由於項目需求時間緊迫和仗着自己經歷了各種考試和剛剛手熱的數學知識,原本准備放棄掉前面幾次有關於數學的課程,雖說直接上機器學習時對於基礎知識這一塊壓力不算太大,但有些地方模糊不清,心底發虛,總想回來看看。在最后聽鄒博的課程后,瞬間變成其腦殘粉,機器學習班的數學課把曾經課本上分的涇渭分明的理論基礎貫穿起來進行了一次頭腦風暴,驀然回首,發現數學原來可以這么玩。
本文按照上課順序分為高等數學部分和概率論部分。在高等數學(微積分)部分主要介紹了極限、導數、梯度、泰勒展開等高數經典問題,並在最后簡單的介紹了凸函數。在概率論部分,我們分享了常用的概率公式包括條件概率、全概率公式以及貝葉斯公式和一些常見的概率分布模型。
預備知識:
高等數學、概率論
高數:
常數e
導數、梯度
Taylor展式
凸函數
概率論
古典概型
常用概率公式
常見概率分布
一、高等數學
1.1 極限與自然底數e
1、什么是自然底數e: ,n越大越e越接近真值
2、證明函數極限:極限存在,值為e,證明方案兩邊夾定理
3、有用的備注:
(1)
(2)單調有界數列必有極限(證明收斂常用方案)
1.2 導數
1、導數的幾何意義:導數就是曲線的斜率,反應曲線的變化快慢。
2、二階導反應斜率的變化快慢,表征曲線的凹凸性。二階導連續的曲線稱為“光順”
1.3 泰勒公式和麥克勞林公式
應用:在計算機中對於三角函數、自然對數等做近似計算提高運算速率。
1.4方向導數和梯度
1、若函數在
可微:則函數在該店沿L方向的導數存在,且有:
,其中
為方向L與X的夾角。
2、梯度是一個向量。記做,
1.5凸函數
澄清一下平時的記憶,在機器學習中這種形狀叫做凸函數。(記憶,上境界是凸集)
1.6 常用導數
思忖再三,還是貼出來以備不時之需。
二、概率論
2.1古典概型:等可能概率模型。
2.2常用概率公式:
2.3常用分布:
1、兩點分布(0-1分布)分布律:
2、二項分布:多次0-1分布
3、泊松分布(跟自然對數有關)
在實際事例中,當一個隨機事件,以固定的平均瞬時速率λ(或稱密度)隨機且獨立地出現時,那么這個事件在單位時間(面積或體積) 內出現的次數或個數就近似地服從泊松分布P(λ)。
例如:某一服務設施在一定時間內到達的人數;電話交換機接到呼叫的次數;汽車站台的候客人數;機器出現的故障數;自然災害發生的次數;一塊產品上的缺陷數;微鏡下單位分區內的細菌分布數;某放射性物質單位時間發射出的粒子數。
跟泊松亮斑沒啥關系。
4、均勻分布
5、指數分布:
無記憶性,如果x是某電器元件的壽命,已知元件使用 了s小時,則共使用至少s+t小時的條件概率,與 從未使用開始至少使用t小時的概率相等。
指數分布可以用來表示獨立隨機事件發生的時間間隔,比如旅客進機場的時間間隔、軟件更新的時間間隔等等。
許多電子產品的壽命分布一般服從指數分布。有的系統的壽命 分布也可用指數分布來近似。它在可靠性研究中是最常用的一種分布形式。
6、正態分布(非常常用的一種分布)
2.4常用分布總結: