macOS 10.14+ 安裝LTP


  LTP是哈爾濱工業大學(HIT,窩工)出品的一個自然語言處理工具包。其功能包括中文分詞(“分詞效果好於jieba分詞”[引用自學長])、詞性標注、實體識別等。

  對於macOS來說,現有的版本可能不多,但最新版依舊支持,這一點和Windows用戶是一樣的。

  總體步驟可以參考如下博客:macOS安裝pyltp

  說實話,上面這篇博客寫的有點繁瑣,建議全都讀一遍,明白各個步驟的操作目的是什么再具體動手鍵入命令。

  下面是安裝過程需要注意的幾點地方:

  一、明確使用pyltp的Python版本

    對我來說,之前用得到的NLP功能並不多,基本分詞就直接用jieba分詞來做了(pip可以直接安裝,鏡像可以從清華鏡像源獲得)。自己平時用的也是Python3.7,但很遺憾,pyltp不支持Python3.7版本!目前pyltp支持的最高版本為Python3.6(我用的是Python3.6.8)。因此對於已經擁有Python3.7的Mac用戶來說,你依然無法用現有的3.7版本進行安裝。

    由於Mac內置了Python2.7版本,所以可以直接用這個版本來安裝使用pyltp(但並不建議這么做,畢竟Python3.x和Python2.x差了很多內容)。多說一句,不建議強迫症用戶刪除Mac內置python版本,因為很多系統內腳本都是基於這個來執行的,無腦刪除易導致得不償失。

    結合自身經歷來說,推薦直接去官網下載Python3.6.8版本Python,這將需要100+MB的磁盤空間。此時對於已經裝過3.7的用戶來說,python3命令將會被新加入的python3.6覆蓋,使用命令別名即可指定python3命令鏈接的具體執行命令(bash下配置文件為.bash_profile,zsh下配置文件為.zshrc)。

 

  二、明確你的macOS版本

    這一點毋庸置疑,上面分享的博客也提到了,修改OS版本號為你的版本號(macOS Sierra就是10.12,macOS High Sierra就是10.13,macOS Mojave就是10.14,WWDC19已公布,macOS Catalina就是10.15)。

 

  三、明確你的clang編譯器

    這一點博客里也提到了,但我覺得有些不妥。修改博客中提到的源文件(泛型那里,照着博客修改一下代碼),目前命令行編譯基本都是由Xcode提供的,所以對於編譯器這一塊,盡量直接裝個Xcode就搞定了,安全且省心)。當你把這些內容都確認好了以后,再執行 $ sudo python setup.py install 命令,當然,這里的python對應着上面提到的你需要安裝的python版本,如果是3.6.x,這里的python就用python3.6替代。在Mac下,python默認指向預裝的python2.7。這樣,你就可以耐心地享受幾分鍾的clang編譯過程了。當編譯結束之后,即可導入pyltp到你的Python環境中了。

 

  此外,模型是需要自行導入的。需要用什么功能,就導入哪個具體模型。模型下載在上面博客里也提到了,至於具體用法,請參閱以下博客:LTP使用指南

 

  如有問題,歡迎指正。

 

  @編輯於2019-06-04

  From Modnar.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM