最優化算法【最小二乘法和梯度下降法】

本文轉載自查看原文 2020-07-29 21:55 666 最優化算法/ algorithm

一、最小二乘法

對於給定的數據集\(D = {(x_1,y_1),(x_2,y_2), ...,(x_m,y_m)}\)，其中\(x_i=(x_{i1};x_{i2}; ...;x_{id})\)。
對上述數據進行擬合：

\[f(x_i)= \hat \omega^T \hat{x_i} \]

其中：\(\hat\omega = (\omega_1;\omega_2; ..., \omega_d;b)\) , \(\hat x_i = (x_{i1};x_{i2}; ...;x_{id};1)\)
最小二乘法是使用均方誤差函數進行度量，可以通過求導，令導數等於零，直接求出解析解。均方誤差函數為：

\[E(\hat \omega)=\frac{1}{m}\sum_{i=1}^m(f(x_i)-y_i)^2 \]

\(X=(x_1^T;x_2^T; ...;x_m^T), Y=(y_1;y_2;...;y_m)\),則：

\[E(\hat \omega)=(X*\hat\omega)^T(X*\hat\omega) \]

上式對\(\omega\)求導，得：

\[\frac{\partial E}{\partial\hat\omega}=\frac{2}{m}X^T(X\hat\omega-Y) \]

令上述導數等於0，得：

\[\hat\omega^*=(X^TX)^{-1}X^TY \]

這就是要求的最優解
使用上述方法，隨機生成三維數據集，使用最小二乘法進行線性回歸

clc;
M = 50;
dim = 2;

X = 10*randn(M,dim);
Y = 10*rand(M,1);
figure(1);
scatter3(X(:,1),X(:,2),Y,'filled');

X_2 = ones(M,1);
X = [X,X_2];

omega = (X'*X)\X'*Y;
[xx,yy] = meshgrid(-20:0.2:20,-20:0.2:20);

zz = omega(1,1)*xx+omega(2,1)*yy+omega(3,1);
hold on;
surf(xx,yy,zz);

效果

二、梯度下降法

相較於均方誤差函數，對\(\omega_j , j = 1, ..., d\)求導得：

\[\frac{\partial f}{\partial \omega_j}=\frac{2}{m}\sum_{i=1}^m x_{ij}(x_{ij}\omega_j-y_i) \]

使用matlab生成三維隨機數，檢驗程序有效性

clc;
close all;
M = 50; %%50個樣本
dim = 2;
N = dim+1;

X = 10*randn(M,dim);
Y = 10*rand(M,1);
figure(1);
scatter3(X(:,1),X(:,2),Y,'filled');

X_2 = ones(M,1);
X = [X,X_2];
iterate = 300;  %%迭代300次
count = 0;
omega = zeros(dim+1,1);
err = 1000;
delta_t = 0.01;
loss_data = zeros(1,iterate);
while count <= iterate && err > 0.1

    count = count+1;
    delta_omega = zeros(N,1);
    for i = 1:N 
        temp_omega = 0;
        for j = 1:M
            temp_omega = temp_omega+X(j,i)*(X(j,i)*omega(i,1)-Y(j,1));    
        end

        delta_omega(i,1) = temp_omega/M;
    end
    omega = omega - delta_t*delta_omega;

    disp(omega);
    err = (Y-X*omega)'*(Y-X*omega);

    disp(err);
    loss_data(1,count) = err;
    
end
[xx,yy] = meshgrid(-20:0.2:20,-20:0.2:20);
% 
zz = omega(1,1)*xx+omega(2,1)*yy+omega(3,1);
hold on;
surf(xx,yy,zz);
figure(2);
 x_t = linspace(0,iterate,size(loss_data,2));
 plot(x_t,loss_data);

效果
樣本和分類面

損失函數隨迭代次數變化

conclusion
1、對於\(\Delta \omega\),注意是軍方誤差，如果不除以數據集元素個數，所得梯度向量的模可能過大，程序不能收斂

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 最小二乘法與梯度下降的區別最小二乘法和梯度下降的區別最優化算法-遞推最小二乘法最小二乘法及梯度下降法運行結果對比（Python版）線性回歸（最小二乘法和梯度下降）最小二乘法及梯度下降法分別對存在多重共線性數據集進行線性回歸（Python版）最優化問題——梯度下降法數值優化(1)-最小二乘法最小二乘法最小二乘法