【Matrix Factorization】林軒田機器學習技法

本文轉載自查看原文 2015-08-14 23:03 3326 機器學習公開課筆記

在NNet這個系列中講了Matrix Factorization感覺上怪怪的，但是聽完第一小節課程就明白了。

林首先介紹了機器學習里面比較困難的一種問題：categorical features

這種問題的特征就是一些ID編號這類的，不是numerical的。

如果要處理這種情況，需要encoding from categorical to numerical

最常用的一種encoding方法就是binary vector encoding（也是實習工作中用過的路子），將binary vector作為輸入。

聯系之前學過的模型，可以用NNet來學習這種映射關系。

但是，binary vector畢竟不是numerical vector，由於每個輸入只在一個維度上是1，其余都是0，因此，NNet中的tanh就沒啥必要了（因為每個輸入數據x喂到每個tanh的只有一個維度的值，輸出也只受這個一個維度的值影響，且tanh是關於x是單調的）。

所以，有了如下的簡化版的Linear Network，即把tanh換成了Σ求和。

這里對符號進行一下說明：

1）V是d×N的矩陣（d是hidden unit的個數，N是user的個數）：V的每個column代表每個user對hidden unit的權重。

2）W’是M×d的矩陣（M是movie的個數）：M的每個row代表的是每個movie關於hidden unit的權重。

考慮每個xn是binary vector，則h(xn) = W’vn（動筆推導一下就OK了）：Linear Network的輸出h(xn)是一個M維的vector，代表每個user對於各個movie的rating。

綜上，Linear Network對於recommender system來說，需要學習的一個是V矩陣（user-hidden unit或latent factor），另一個是W矩陣（item-hidden或latent factor）。

在介紹學習方法之前，林重新整理了一下Linear Network問題。

linear network對於m-th movie來說：就是有一個對應的Wm'來對轉換后的x進行線性加權hm(x) = Wm' fi(x)。

因此，學習目標也了然了：

1）transform的系數矩陣

2）linear model的系數矩陣

綜上，由於Linear Network的輸入是binary vector的，因此對原Linear Network問題做一個變形：rnm = Wm'Vn → R = V‘W，即轉化成一個matrix factorization問題。（個人非常喜歡這段motivation的講解，matrix factorization為什么在NNet這部分出現也理解了）

關於Linear Network轉化成Matrix Factorization問題的推導，按照個人理解，我再多寫兩筆：

h(x) = W'Vx （在前面的PPT中找）

　　 = (Vx)'W （由於h(x)是一個向量所以顛倒一下沒關系了，輸出h(x)由原來的列向量變成了行向量了，但對應位置的值不變）

　　 = x'V'W （(AB)'=B'A'，矩陣轉置運算性質）

則h(X) = X'V'W （按行補上所有的輸入xn=1...N）

　　　 = I(N) V'W （X’矩陣每一行代表一個輸入的binary vector，這里按照編號順序排布X，所以X'就是一個單位陣嘍）

　　 = V'W （原始的Linear Network問題轉化為Basic Matrix Factorization問題了）

並且，這種分解是可以加上些物理意義的：可以把每個hidden unit當成是一種隱含特征（喜劇、動作...）。V和W代表user與movie與hidden unit的關系。

下面講求解模型的方法：