【機器學習】使用偽標簽進行半監督學習

本文轉載自查看原文 2021-10-30 11:40 800 機器學習

使用偽標簽進行半監督學習，在機器學習競賽當中是一個比較容易快速上分的關鍵點。下面給大家來介紹一下什么是基於偽標簽的半監督學習。在傳統的監督學習當中，我們的訓練集具有標簽，同時，測試集也具有標簽。這樣我們通過訓練集訓練到的模型就可以在測試集上驗證模型的准確率。

然而使用偽標簽的話，我們則可以使用訓練集訓練出一個最好的模型，然后再去除測試集的真實的標簽，然后用這個已經train好的模型去predict測試集的標簽。然后將這個predict后的標簽假裝認為是真實的標簽，也就是“偽標簽”。將其放到原來的訓練集當中，同時再次開始訓練出一個最新的model。

最后再用這個最新的model，在我們的測試集上用真實的標簽來驗證模型的正確性。整體流程如下圖所示：

在半監督學習當中，用無標簽數據的優點如下:

具體的步驟整理如下，和大家一起看一下：

將有標簽部分數據分為兩份：train_set&validation_set，並訓練出最優的model1
用model1對未知標簽數據(test_set)進行預測，給出偽標簽結果pseudo-labeled
將train_set中抽取一部分做新的validation_set，把剩余部分與pseudo-labeled部分融合作為新的train_set，訓練出最優的model2
再用model2對未知標簽數據(test_set)進行預測，得到最終的final result label

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【機器學習】半監督學習機器學習中的有監督學習，無監督學習，半監督學習機器學習分類之監督學習、無監督學習和強化學習機器學習一 -- 什么是監督學習和無監督學習？監督學習與無監督學習的區別_機器學習機器學習有監督學習之--回歸 04機器學習之無監督學習 <機器學習>無監督學習算法總結 Spark機器學習基礎-監督學習【機器學習基礎】無監督學習（1）——PCA