torch.full(size, fill_value, …) #返回大小为sizes,单位值为fill_value的矩阵t
1、预处理
流程:原始文本-》分词-》清洗-》标准化-》特征提取-》建模
词干提取&词型还原:leaves
leav leaf
停用词:
nltk英文停用词表
中文可以下载
2.网络结构
3.知识梳理
4.Gensim
一款开源的第三方python包,从原始的非结构化文本中,无监督学习文本隐层的主题向量表达,支持TFIDF,LSA,LDA,Word2vec主题模型算法