一、什么是gensim
gensim是一個python的科學庫,gensim包含了TF-IDF、隨機投影、word2vec和document2vec算法的實現,分層Dirchlet過程(HDP),潛在語義分析(LSA)和潛在Dirichlet分配(LDA),包括分布式並行版本。主要是用來主題建模、文檔索引以及使用大規模語料數據的相似性檢索,被作者稱為“根據純文本進行監督性建模最健壯、最有效的、最讓人放心的軟件”。
二、gensim安裝的注意事項
gensim可以安裝在Windows、Linux和Mac OS以及其他的平台,但是它需要依賴python和numpy以及scipy,如下圖
至於numpy和scipy的安裝我們可以直接安裝一個anaconda就可以了,它也是python的一個科學計算庫,它包含了python常用的科學計算庫。
三、安裝步驟
1、在安裝anaconda之后,找到anaconda的安裝路徑,將anaconda下的scripts目錄添加到,計算機-->屬性-->高級系統設置-->高級-->環境變量-->系統變量-->找到path變量,將C:\Users\15053\Anaconda3\Scripts添加到path中,這個目錄是我安裝anaconda的目錄,根據自己電腦的安裝目錄進行配置。
2、windows+r-->輸入cmd-->輸入python,如果出現如下圖的提示說明配置成功了
3、找到anaconda的安裝目錄,在箭頭指示的欄中輸入cmd,然后打開命令提示符界面之后,輸入pip install gensim安裝gensim
4、輸入命令可以安裝gensim,發現出現異常,原因為pip版本不正常,按照提示升級
5、重新安裝gensim
6、驗證gensim是否安裝成功,打開cmd輸入python之后,然后在輸入import gensim,出現下圖一樣,就表示安裝成功了
特別提醒:如果,安裝完成之后發現import gensim沒有問題,但是使用from gensim import word2vec時報錯時,這里有點疑問。安裝成功的標志是你可以在代碼里做下面的import而不出錯:from gensim.models import word2vec