gensim加載詞向量文件

本文轉載自查看原文 2020-02-01 11:06 1345

# -*- coding: utf-8 -*-
# author: huihui
# date: 2020/1/31 7:58 下午 

'''
根據語料訓練詞向量，並保存向量文件
'''

import os
import sys
import gensim

os.reload(sys)
sys.setdefaultencoding('utf-8')

# 需要提前分詞
input_file = "corp_seg.txt"
sentences = gensim.models.word2vec.Text8Corpus(input_file)

# 訓練詞向量
model = gensim.models.word2vec.Word2Vec(sentences, sg=1, size=100, window=5, min_count=1, negative=3, sample=0.001,
                                        hs=1, workers=40)

# 保存詞向量文件
model.save("corp_word2vec.model")
model.wv.save_word2vec_format("corp_word2vec.txt")

# 加載詞向量文件
model = gensim.models.word2vec.Word2Vec.load("corp_word2vec.model")
model = gensim.models.KeyedVectors.load_word2vec_format("corp_word2vec.txt")

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python之利用 gensim的word2vec進行酒店評論+wiki百科語料聯合詞向量訓練使用gensim之KeyedVectors操作詞向量模型詞袋和詞向量模型如何產生好的詞向量詞向量聚類實驗學習筆記---詞向量與詞嵌入【騰訊詞向量】騰訊中文預訓練詞向量 doc2vec 利用gensim 生成文檔向量 word2vec生成詞向量和字向量英文詞向量：使用fastText預訓練的詞向量