最優化方法：拉格朗日乘數法

本文轉載自查看原文 2018-05-18 19:14 16563 機器學習/ 數學

https://blog.csdn.net/pipisorry/article/details/52135854

https://blog.csdn.net/yujianmin1990/article/details/48494607

解決約束優化問題——拉格朗日乘數法

拉格朗日乘數法（Lagrange Multiplier Method）應用廣泛，可以學習麻省理工學院的在線數學課程。

拉格朗日乘數法的基本思想

　　作為一種優化算法，拉格朗日乘子法主要用於解決約束優化問題，它的基本思想就是通過引入拉格朗日乘子來將含有n個變量和k個約束條件的約束優化問題轉化為含有（n+k）個變量的無約束優化問題。拉格朗日乘子背后的數學意義是其為約束方程梯度線性組合中每個向量的系數。

　　如何將一個含有n個變量和k個約束條件的約束優化問題轉化為含有（n+k）個變量的無約束優化問題？拉格朗日乘數法從數學意義入手，通過引入拉格朗日乘子建立極值條件，對n個變量分別求偏導對應了n個方程，然后加上k個約束條件（對應k個拉格朗日乘子）一起構成包含了（n+k）變量的（n+k）個方程的方程組問題，這樣就能根據求方程組的方法對其進行求解。

　　解決的問題模型為約束優化問題：

　　min/max a function f(x,y,z), where x,y,z are not independent and g(x,y,z)=0.

　　即：min/max f(x,y,z)

　　　　s.t. g(x,y,z)=0

數學實例

　　首先，我們先以麻省理工學院數學課程的一個實例來作為介紹拉格朗日乘數法的引子。

　　【麻省理工學院數學課程實例】求雙曲線xy=3上離遠點最近的點。

　　解：

　　首先，我們根據問題的描述來提煉出問題對應的數學模型，即：

　　min f(x,y)=x2+y2（兩點之間的歐氏距離應該還要進行開方，但是這並不影響最終的結果，所以進行了簡化，去掉了平方）

　　s.t. xy=3.

　　根據上式我們可以知道這是一個典型的約束優化問題，其實我們在解這個問題時最簡單的解法就是通過約束條件將其中的一個變量用另外一個變量進行替換，然后代入優化的函數就可以求出極值。我們在這里為了引出拉格朗日乘數法，所以我們采用拉格朗日乘數法的思想進行求解。

　　我們將x2+y2=c的曲線族畫出來，如下圖所示，當曲線族中的圓與xy=3曲線進行相切時，切點到原點的距離最短。也就是說，當f(x,y)=c的等高線和雙曲線g(x,y)相切時，我們可以得到上述優化問題的一個極值（注意：如果不進一步計算，在這里我們並不知道是極大值還是極小值）。

　　現在原問題可以轉化為求當f(x,y)和g(x,y)相切時，x,y的值是多少？

　　如果兩個曲線相切，那么它們的切線相同，即法向量是相互平行的，▽f//▽g.

　　由▽f//▽g可以得到，▽f=λ*▽g。

　　這時，我們將原有的約束優化問題轉化為了一種對偶的無約束的優化問題，如下所示：

　　原問題：min f(x,y)=x2+y2 對偶問題：由▽f=λ*▽g得，

　　　　　　s.t. xy=3 fx=λ*gx，

　　 fy=λ*gy，

xy=3.

約束優化問題無約束方程組問題

　　通過求解右邊的方程組我們可以獲取原問題的解，即

　　2x=λ*y

　　2y=λ*x

　　xy=3

　　通過求解上式可得，λ=2或者是-2；當λ=2時，(x,y)=(sqrt(3), sqrt(3))或者(-sqrt(3), -sqrt(3))，而當λ=-2時，無解。所以原問題的解為(x,y)=(sqrt(3), sqrt(3))或者(-sqrt(3), -sqrt(3))。

　　通過舉上述這個簡單的例子就是為了體會拉格朗日乘數法的思想，即通過引入拉格朗日乘子(λ)將原來的約束優化問題轉化為無約束的方程組問題。

皮皮blog

拉格朗日乘數法的基本形態

　　求函數在滿足下的條件極值，可以轉化為函數的無條件極值問題。

　　我們可以畫圖來輔助思考。

　　綠線標出的是約束g(x,y)=c的點的軌跡。藍線是f(x,y)的等高線。箭頭表示斜率，和等高線的法線平行。

　　從圖上可以直觀地看到在最優解處，f和g的斜率平行。

　　▽[f(x,y)+λ(g(x,y)−1)]=0, λ≠0

　　一旦求出λ的值，將其套入下式，易求在無約束極值和極值所對應的點。

　　F(x,y)=f(x,y)+λ(g(x,y)−c)

　　新方程F(x,y)在達到極值時與f(x,y)相等，因為F(x,y)達到極值時g(x,y)−c總等於零。

　　上述式子取得極小值時其導數為0，即▽f(x)+▽∑λigi(x)=0，也就是說f(x)和g(x)的梯度共線。

　　題目1：

　　給定橢球

　　求這個橢球的內接長方體的最大體積。這個問題實際上就是條件極值問題，即在條件

　　下，求的最大值。

　　當然這個問題實際可以先根據條件消去，然后帶入轉化為無條件極值問題來處理。但是有時候這樣做很困難，甚至是做不到的，這時候就需要用拉格朗日乘數法了。通過拉格朗日乘數法將問題轉化為

　　對求偏導得到

　　聯立前面三個方程得到和，帶入第四個方程解之

　　帶入解得最大體積為

　　拉格朗日乘數法對一般多元函數在多個附加條件下的條件極值問題也適用。

　　題目2：

　　題目：求離散分布的最大熵。

　　分析：因為離散分布的熵表示如下

而約束條件為

要求函數的最大值，根據拉格朗日乘數法，設

對所有的求偏導數，得到

計算出這個等式的微分，得到

這說明所有的都相等，最終解得

因此，使用均勻分布可得到最大熵的值。

皮皮blog

拉格朗日乘數法與KKT條件

拉格朗日乘數法

　　對於第二種形式，帶約束條件的問題，我們更傾向於將其轉化為無約束問題。在數學最優化問題中，拉格朗日乘數法是一種尋找變量受一個或多個條件所限制的多元函數的極值的方法。這種方法將一個有n 個變量與k 個約束條件的最優化問題轉換為一個有n + k個變量的方程組的極值問題，其變量不受任何約束。這種方法引入了一種新的標量未知數，即拉格朗日乘數（：約束方程的梯度（gradient）的線性組合里每個向量的系數，搞不懂這句話在說神馬）。
　　上面這段話讀起來挺繞的，還是舉個例子吧。
　　目標是求 $f (x, y) = x^{2} * y$

　　上圖中， $f (x, y)$

對邏輯回歸里懲罰的解釋

　　現在回過頭來看，線性回歸目標函數里面的懲罰，是怎么個情況，明白了沒？結果發現還是沒能夠解釋為什么要加懲罰 $\frac{1}{2} w^{T} w$

KKT條件下最優求解

　　對於第三種情況，又有等式約束，又有不等式約束的，怎么搞呢？上面我們是用拉格朗日乘數法搞定的等式約束的問題，那么對於包括有不等式約束的，可不可以把拉格朗日乘數法擴展一下，充分利用它，解決現在的問題呢？答案是可以，就是滿足KKT條件時的最值求解。
　　KKT條件：在滿足一些有規則的條件下，一個非線性規划（Nonlinear Programming）問題能有最優化解的一個必要和充分條件。這是一個廣義化拉格朗日乘數的成果，KKT是三個作者的首字母，Karush & Kuhn &Tucker。
　　求解的問題是：
　　

m i n f (w)

$f (x, y)$

小結

　　約束下的函數最值問題求解，即將約束問題轉化為無約束問題，然后再去解決。
　　中間會有一些小技巧，自己需要在實際應用中靈活應變。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 拉格朗日乘數法解含不等式約束的最優化問題拉格朗日乘數法思考：線性規划對偶與拉格朗日乘數法 [OI筆記]利用拉格朗日乘數法求函數的最值多變量微積分筆記6——拉格朗日乘數法尋找“最好”（3）——函數和泛函的拉格朗日乘數法拉格朗日乘數法，一種計算條件極值的方式拉格朗日乘子/拉格朗日乘數（Lagrange multiplier）拉格朗日插值法拉格朗日次梯度法