gensim加載word2vec訓練結果(bin文件)並進行相似度實驗

本文轉載自查看原文 2017-05-31 10:34 9492 NLP

# -*- coding: utf-8 -*-  
import gensim  

# 導入模型
model = gensim.models.KeyedVectors.load_word2vec_format('vectors.bin', binary=True)

# 得到兩組詞的相似度
list1 = [u'核能']
list2 = [u'電能']
list3 = [u'電力']
list_sim1 =  model.n_similarity(list1, list2)
print list_sim1
list_sim2 = model.n_similarity(list2, list3)
print list_sim2, '\n'

# 得到一組詞中最無關的詞
list4 = [u'汽車', u'火車', u'飛機', u'北京']
print model.doesnt_match(list4)
print '\n'

# 得到與一個詞最相關的若干詞及相似程度
result = model.most_similar(u'脫水工藝')
for each in result:
    print each[0] , each[1]

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 利用python中的gensim模塊訓練和測試word2vec gensim ——訓練word2vec詞向量的使用方法。用word2vec對語料進行訓練 gensim中的word2vec 用gensim學習word2vec Python之利用 gensim的word2vec進行酒店評論+wiki百科語料聯合詞向量訓練 gensim Word2Vec 訓練和使用(Model一定要加載到內存中，節省時間！！！) python實現word2vec訓練結果bin文件轉txt文件 Gensim進階教程：訓練word2vec與doc2vec模型 Word2Vec 計算詞語之間的余弦相似度