問題描述:m examples : (x(1),y(1)), (x(2),y(2)),..., (x(m),y(m)) and n features;
計算方法:θ = (XTX)-1XTy;
計算過程:
(1) x(i) = [ x0(i)
x1(i)
...
xn(i)
]
為列矩陣;
(2)design matrix:
X = [
(x(1))T
(x(2))T
(x(3))T
...
(x(n))T
]
(3)compute with the format
θ = (XTX)-1XTy;
和梯度下降比較
(1)梯度下降:
需要選擇速率α;
需要許多迭代;
當n取值很大(n >= 106)時效果更好;
(2)正規方程:
不需要選擇速率α;
不需要很多次的迭代;
需要進行矩陣計算,復雜度為O(n3)
適用於n比較小的情況;