gensim加载word2vec训练结果(bin文件)并进行相似度实验

本文转载自查看原文 2017-05-31 10:34 9492 NLP

# -*- coding: utf-8 -*-  
import gensim  

# 导入模型
model = gensim.models.KeyedVectors.load_word2vec_format('vectors.bin', binary=True)

# 得到两组词的相似度
list1 = [u'核能']
list2 = [u'电能']
list3 = [u'电力']
list_sim1 =  model.n_similarity(list1, list2)
print list_sim1
list_sim2 = model.n_similarity(list2, list3)
print list_sim2, '\n'

# 得到一组词中最无关的词
list4 = [u'汽车', u'火车', u'飞机', u'北京']
print model.doesnt_match(list4)
print '\n'

# 得到与一个词最相关的若干词及相似程度
result = model.most_similar(u'脱水工艺')
for each in result:
    print each[0] , each[1]

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 利用python中的gensim模块训练和测试word2vec gensim ——训练word2vec词向量的使用方法。用word2vec对语料进行训练 gensim中的word2vec 用gensim学习word2vec Python之利用 gensim的word2vec进行酒店评论+wiki百科语料联合词向量训练 gensim Word2Vec 训练和使用(Model一定要加载到内存中，节省时间！！！) python实现word2vec训练结果bin文件转txt文件 Gensim进阶教程：训练word2vec与doc2vec模型 Word2Vec 计算词语之间的余弦相似度