對比學習的出現,是圖像領域為了解決“在沒有更大標注數據集的情況下,如何采用自監督預訓練模式,來從中吸取圖像本身的先驗知識分布,得到一個預訓練的模型”。
對比學習是自監督學習的一種,也就是說,不依賴標注數據,要從無標注圖像中自己學習知識。
目前,對比學習貌似處於“無明確定義、有指導原則”的狀態,它的指導原則是:通過自動構造相似實例和不相似實例,要求習得一個表示學習模型,通過這個模型,使得相似的實例在投影空間中比較接近,而不相似的實例在投影空間中距離比較遠。
對比學習涉及到的一些關鍵點:
-
如何構造相似實例,以及不相似實例;
-
如何構造能夠遵循上述指導原則的表示學習模型結構;
-
以及如何防止模型坍塌(Model Collapse);
對比學習(contrastive learning)是被看作是一種自監督學習方法(SSL,Self-supervised Learning),本質上是為了在數據標簽的設定下為數據學習到一個良好的表示。因此,對比學習本質上仍然可以看做是一種表示(representation)學習。
對比學習主要包含3個步驟:
1.數據增強
2.送入神經網絡進行編碼
3.計算損失
附兩篇比較通俗易懂的博客
對比學習的淺顯總結及其在NLP下的應用 - 知乎 (zhihu.com)