word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包,它簡單、高效,因此引起了很多人的關注。由於 word2vec 的作者 Tomas Mikolov 在兩篇相關的論文 [3,4] 中並沒有談及太多算法細節,因而在一定程度上增加了這個工具包的神秘感。一些按捺不住的人於是選擇了通過解剖源代碼的方式來一窺究竟,出於好奇,我也成為了他們中的一員。讀完代碼后,覺得收獲頗多,整理成文,給有需要的朋友參考。
目錄
(一)目錄和前言
(二)預備知識
(三)背景知識
(四)基於 Hierarchical Softmax 的模型
(五)基於 Negative Sampling 的模型
(六)若干源碼細節
作者: peghoty
出處: http://blog.csdn.net/itplus/article/details/37999613
歡迎轉載/分享, 但請務必聲明文章出處.