機器學習數學筆記|微積分梯度jensen不等式


機器學習數學筆記|微積分梯度jensen不等式

覺得有用的話,歡迎一起討論相互學習~

我的微博我的github我的B站

原創文章,如需轉載請保留出處
本博客為七月在線鄒博老師機器學習數學課程學習筆記
為七月在線打call!!
課程傳送門

索引

  • 微積分,梯度和Jensen不等式
  • Taylor展開及其應用
  • 常見概率分布和推導
  • 指數族分布
  • 共軛分布
  • 統計量
  • 矩估計和最大似然估計
  • 區間估計
  • Jacobi矩陣
  • 矩陣乘法
  • 矩陣分解RQ和SVD
  • 對稱矩陣
  • 凸優化

微積分與梯度

  • 常數e的計算過程
  • 常見函數的導數
  • 分部積分法及其應用
  • 梯度
    • 上升/下降最快方向
  • 凸函數
    • Jensen不等式

自然常數e

引入

  • 我們知道對於公式\(y=log_{a}x\),x=1時,y=0.則我們是否能找一點a值,使得y函數在(1,0)點的導數為1呢?

利用導數公式對\(y=log_{a}x\)求導

定理一:極限存在定理

  • 單調有界函數必有極限
  • 單調數列有上線,必有其極限

構造數列Xn證明其單調有上界

  • 又因為其有(1+1)項,則其必比2要大然而又比3要小,則\(2<X_n<3\)

定理二:兩邊夾定理

自然常數e的推導

\[自然常數e可以看做e=1+\frac{1}{1!}+\frac{1}{2!}+\frac{1}{3!}+\frac{1}{4!}+...+\frac{1}{n!} \]

微分與積分

常用函數的導數公式

分部積分法

方向導數與梯度


對於方向導數我們也可以視為

\[(\frac{\partial f}{\partial x},\frac{\partial f}{\partial y}).(cos\varphi.sin\varphi)^{T} \]

  • 方向導數顧名思義既是復合函數在某一方向上的導數,表示函數在某一方向上的變化趨勢。當在某一方向上的方向導數最大時,即是梯度

\[cos\varphi =\frac{\partial f}{\partial x}\\sin\varphi = \frac{\partial f}{\partial y} \]

時,這是方向導數取最大值,即是梯度

對於梯度我們有

  • 方向導數是各個方向上的導數
  • 偏導數連續才有梯度存在
  • 梯度的方向是方向導數中取到最大值的方向,梯度的值是方向導數的最大值

凸函數與Jsnsen不等式

  • 簡而言之,即是函數的割線永遠位於函數圖像的上方.

一階可微

  • 簡而言之,即是函數如果是一個凸函數,且一階可微,則過函數任意一點做函數的切線,函數的切線永遠在函數的下方.

二階可微

凸函數舉例

Jensen不等式

  • Jensen不等式相當於把凸函數的概念反過來說,即是如果f是一個凸函數,任意取一個在f定義域上的(x,y)點,\(\theta\)屬於[0,1].
  • 當只有x,y兩個參數,即是使用 基本Jensen不等式 ,然而當推廣到k個參數時, 即是表示參數的線性加權的函數值總要小於函數值的線性加權.
  • 可以將其推廣到概率密度分布上,假設\(\theta\)表示是事件的概率密度K點分布即所加和為1,則函數值的期望大於期望的函數值


    PS:這都是在f是凸函數的狀況下!
  • Jensen不等式是所有不等式的基礎,所有不等式都能看做是Jensen不等式利用不同的凸函數推導出來的.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM