相比與bow(bag of word),兩個都是特征的降維,
bow 每個詞是一個文檔向量中的一維
而one-hot是一個詞本身是一個向量(一維是1,其他是0),不同詞之間的區別是1的位置不同,但是1的位置不表示實際意義
而word2vec中,每個詞用一個實數向量表示,語義相近的詞的向量夾角余弦相似度更相近 比如 都是水果等等
one-hot和word2vec 都屬於 distributed represent 表示法
word2vec可能需要涉及到一些聚類等,具體還沒深入研究
相比與bow(bag of word),兩個都是特征的降維,
bow 每個詞是一個文檔向量中的一維
而one-hot是一個詞本身是一個向量(一維是1,其他是0),不同詞之間的區別是1的位置不同,但是1的位置不表示實際意義
而word2vec中,每個詞用一個實數向量表示,語義相近的詞的向量夾角余弦相似度更相近 比如 都是水果等等
one-hot和word2vec 都屬於 distributed represent 表示法
word2vec可能需要涉及到一些聚類等,具體還沒深入研究
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。