本文轉載自查看原文 2021-05-12 11:51 1598 機器學習

最近有在面試一些公司，有被問題關於lr的一些問題，還有包括L1和L2正則的一些問題，回答的不是很好，發現有時候自己明白了，過了一陣子又會忘記，現在整理整理，寫成博客防止以后再次忘記

我們基於lr模型來講正則，首先y=sigmiod（wx+b）這是基本的lr模型。損失函數為0,1交叉熵，

L1正則：

l2 正則：

使用等高線圖來表示原目標函數的圖像為（假定只有兩個參數）：

也就是說，當參數

　　第一個圖中菱形即為

討論為什么l1正則之后的特征參數是稀疏的？

因為觀察發現**幾乎對於很多原函數等高曲線，和某個菱形相交的時候及其容易相交在坐標軸（比如上圖）：

另外一考慮正則項導數的情況，l1正則的倒數不是-1就是1，所以會很容易收斂到0；然而l2正則的倒數是線性函數，w越靠近0的話導數就越小，這會讓w無限趨近於0，但不會收斂到0；

l1正則不可導怎么處理？

坐標軸下降法

參考鏈接: https://www.cnblogs.com/lliuye/p/9354972.html

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 L1、L2正則化詳解機器學習中正則懲罰項L0/L1/L2范數詳解 L1和L2正則化。L1為什么能產生稀疏值，L2更平滑 L1,L2正則化與損失正則化項L1和L2的區別 tensorflow 中的L1和L2正則化損失函數———有關L1和L2正則項的理解 L1與L2損失函數和正則化的區別 L1比L2更稀疏深度學習正則化--L0、L1、L2正則化