Learn to Rank

排序學習主要用於搜索引擎，推薦系統等領域。

對於傳統的排序算法，一般只能根據少量特征，然后通過人為設定的規則，來進行文檔的全量排序。

然而對於排序涉及大量的特征，而且這些特征難以人為的編輯規則來進行文檔和文檔之間的比較，這就出現了排序學習。

排序學習通過以特征和文檔為輸入，通過機器學習或者神經網絡的方法，最終輸出對於某個查詢，每個文檔的相關度分數，進而實現可以進行對文檔的排序。

范式

l2r-model

l2r-pointwise
L2R-pointwise-rank

l2r-pairwise-model
輸出的0/1代表doc1是否大於doc2

可以直接應用以后的分類算法

L2R-pairwise

i2r-listwise

i	reli	log2(i+1)	reli /log2(i+1)
1	3	1	3
2	2	1.58	1.26
3	3	2	1.5
4	0	2.32	0
5	1	2.58	0.38
6	2	2.8	0.71

i	reli	log2(i+1)	reli /log2(i+1)
1	3	1	3
2	3	1.58	1.89
3	3	2	1.5
4	2	2.32	0.86
5	2	2.58	0.77
6	1	2.8	0.35

可以看出，IDCG是固定的，對DCG的優化過程，DCG的值呈現跳躍性改變，因此DCG是非連續函數，這導致以NDCG為代表的損失函數，很難使用現代的優化算法來優化。

由於NDCG的非連續性，這就引入了lambda為梯度的損失函數

通過定義loss的梯度，不需要通過求導，而是直接求得lambda的梯度，然后通過反向傳播到上層的model，優化模型的參數，這樣就避免了最后的loss是非連續函數不可導的缺點
最后梯度=lambda(i)
lambda>0，則趨於上升
lambda<0，則趨於下降

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 原創：機器學習排序深入解讀機器學習入門-顯示特征重要性的排序機器學習排序算法：RankNet to LambdaRank to LambdaMART python 機器學習什么是多模態機器學習？ spark機器學習機器學習（七）—回歸機器學習個人總結開始機器學習機器學習概覽