計算機視覺算法聽起來似乎很高、大、上,以至於我們很難動手實現,然而事實真的如此嗎?下面筆者將最近關於計算機視覺算法的一點認識分享出來,敬請大家批評指正。
以文本分類問題為例,文本分類追求的目標就是將一篇特定的文本歸到某個已有的類比當中(例如將有關NBA球星科比的報道,歸到體育)。這個已有的類別可以是人工設定的,也可以是機器自動學習的。在初次接觸到上述問題時,我感到大腦一篇空白,進而開始懊惱自己的無知,然后沮喪、抑郁等情緒接踵而至。但在調研了一些書籍、論文和代碼之后,筆者發現問題似乎也沒有原本認為的那么難,之所以這麽說是因為自己有了下面一些認識。
圖1 計算機視覺算法框架示意圖
細想起來,文本分類問題可以分解為以下幾個字問題:如何收集文本、如何確定文本分類的模型、如何評價文本分類模型的好壞、如何將分類的結果很好的展示,分別對應圖1的數據、模型、評價、顯示。
總結:每一個子問題都對應着一系列的函數實現,應該清楚的是,每個子問題之間是通過數據進行信息傳遞的,例如數據是為模型提供原材料的(數據應該加工為模型能夠理解的形式)。