在線學習和在線凸優化（online learning and online convex optimization）—凸化方法4

本文轉載自查看原文 2018-09-01 16:47 1911 在線學習/ 在線凸優化/ 機器學習

　　一些在線預測問題可以轉化到在線凸優化框架中。下面介紹兩種凸化技術：

　　一些在線預測問題似乎不適合在線凸優化框架。例如，在線分類問題中，預測域（predictions domain）或損失函數不是凸的。我們描述了兩種凸化技術，它們允許我們在其他場景中使用在線凸優化框架。

　　1.Convexification by Randomization

　　為了演示randomization技術，我們考慮一個專家建議的預測問題：每個在線回合中，學習者必須從d位給定專家的建議中進行選擇。

　　表示選到的專家，然后學習機收到一個向量，其中表示聽從第個專家的建議所遭受的損失，學習機需要支付的損失為。在這種情況下，decision space是離散的，因此非凸。

　　有限假設類（finite hypothesis class）的在線分類問題可以很容易地作為具有專家建議問題的預測的特例。因此，Cover’s impossibility result意味着沒有算法可以通過專家建議問題獲得預測的low Regret。

　　然而，正如我們在下面所示，通過允許學習者隨機化他的預測，我們可以將問題轉化為在線凸優化框架，因此可以獲得針對該問題的low Regret算法。令是probability simplex，S是一個凸集。　　

　　在第 t回合，學習者選擇，並且基於根據隨機抽取一個專家，學習機支付期望損失：

　　現在，我們將問題轉化成了在線凸優化。

　　2.Convexification by Surrogate Loss Functions

　　為了解釋第二種凸化技術，我們再次從有限假設類的在線分類具體問題開始。回想一下，我們用來回避 Cover’s impossibility result的技術之一依賴於可實現性假設（realizability assumption）。我們假設存在使得對於所有的t有。有了這個假設，我們描述了Halving算法並且表明它最多個預測錯誤。我們現在使用在線凸優化語言得出類似的保證: