torch.full(size, fill_value, …) #返回大小為sizes,單位值為fill_value的矩陣t
1、預處理
流程:原始文本-》分詞-》清洗-》標准化-》特征提取-》建模
詞干提取&詞型還原:leaves
leav leaf
停用詞:
nltk英文停用詞表
中文可以下載
2.網絡結構
3.知識梳理
4.Gensim
一款開源的第三方python包,從原始的非結構化文本中,無監督學習文本隱層的主題向量表達,支持TFIDF,LSA,LDA,Word2vec主題模型算法