先簡單歸納一下,后續記一個詳細的筆記把。
摘要部分
對於用戶冷啟動的解決方法,一般是先給出一些候選的商品,然后通過用戶對這些候選商品的偏好進行推薦。這么做有兩個問題:
1. 活躍度(后續行為信息很少的用戶)推薦的效果很差
2 .候選的商品過少或者不准備,不能夠較好的反應用戶的偏好
介紹部分
在常規冷啟動解決方法中,基於內容的方法忽視了用戶的偏好、基於混合內容的協同過濾方法當交互信息很稀疏的時候效果很不好,而且用戶個人信息是隱私不好處理。還有一些推薦系統先選取一些候選商品給用戶,然后通過用戶的反饋來預估用戶的偏好(proposed recommender model)。 對於新用戶而言,初始的一個較好的推薦能夠更好的留住用戶,MeLU的意圖也在此。
Model-Agnostic Meta-Learning ,目的從多個不同的學習任務中學習到一個模型,面對新的task時能夠借助以往的學習知識以及少量的新樣本快速地適應到新的任務上。(這里實際上是找到一個合適的參數初始化值)。MAML即為參數學習到一個好的初始化,然后在這個初始化的基礎上利用少量更新來訓練新的task。(分兩步,第一步對不同的任務進行學習,第二部第一步的模型來學習新的任務,並計算loss來更新初始化參數)
元學習側重於通過僅使用少量訓練數據進行學習來改善分類或回歸性能。元學習分為:基於度量、基於內存、基於優化三類。本文使用的是基於優化的元學習。
(待續)