ALS算法參數:

// ALS關鍵代碼

val model =ALS.train(訓練集,rank,循環次數iter,lambda)

那是怎么想到要這樣設置的呢？那就要在了解算法的基礎上來設置此參數；

1、訓練集，數據格式：（用戶id 物品id 評分(0-1) ）

2、rank，根據數據的分散情況測試出來的值，特征向量緯度，如果這個值太小擬合的就會不夠，誤差就很大；如果這個值很大，就會導致模型大泛化能力較差；所以就需要自己把握一個度了，一般情況下10～1000都是可以的；

3、循環次數iter，這個設置的越大肯定是越精確，但是設置的越大也就意味着越耗時；

4、 lambda也是和rank一樣的，如果設置很大就可以防止過擬合問題，如果設置很小，其實可以理解為直接設置為0，那么就不會有防止過擬合的功能了；怎么設置呢？可以從0.0001 ，0.0003，0.001，0.003，0.01，0.03，0.1，0.3，1，3，10這樣每次大概3倍的設置，先大概看下哪個值效果比較好，然后在那個比較好的值（比如說0.01）前后再設置一個范圍，比如（0.003，0.3）之間，間隔設置小點，即0.003，0.005，0.007，0.009，0.011，，，，。當然，如果機器性能夠好，而且你夠時間，可以直接設置從0到100，間隔很小，然后一組參數一組的試試也是可以的。

模型修改策略
過擬合：增大數據規模、減小數據特征數（維數）、增大正則化系數λ

欠擬合：增多數據特征數、添加高次多項式特征、減小正則化系數λ

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 基於Spark ALS算法的個性化推薦 Spark2.0協同過濾與ALS算法介紹 Spark機器學習(10)：ALS交替最小二乘算法為什么spark中只有ALS Spark Mllib里的協調過濾的概念和實現步驟、LS、ALS的原理、ALS算法優化過程的推導、隱式反饋和ALS-WR算法使用Spark MLlib中推薦算法ALS對電影評分數據MovieLens推薦 SparkML之推薦算法ALS 機器學習——ALS算法 spark MLlib 概念 6：ALS（Alternating Least Squares） or (ALS-WR) 協同過濾 CF & ALS 及在Spark上的實現