word2vec和one-hot


相比與bow(bag of word),兩個都是特征的降維,

bow 每個詞是一個文檔向量中的一維

而one-hot是一個詞本身是一個向量(一維是1,其他是0),不同詞之間的區別是1的位置不同,但是1的位置不表示實際意義

而word2vec中,每個詞用一個實數向量表示,語義相近的詞的向量夾角余弦相似度更相近 比如 都是水果等等

one-hot和word2vec 都屬於 distributed represent 表示法

word2vec可能需要涉及到一些聚類等,具體還沒深入研究


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM