讓盤古分詞支持最新的Lucene.Net 3.0.3


好多年沒升級過的Lucene.Net最近居然升級了,到了3.0.3后接口發生了很大變化,原來好多分詞庫都不能用了,所以上次我把MMSeg給修改了一下支持了Lucene.Net 3.0.3(參考《基於MMSeg算法的中文分詞類庫》)。

然后我知道了.Net下還有一個盤古分詞(http://pangusegment.codeplex.com/),但也不支持Lucene.Net 3.0.3,網上也不少人在問,於是就下載了它的最新代碼,基於Lucene.Net 3.0.3更新了,順便把它的詞庫給放到dll里面了,不然每次還要拷貝一個Dictionaries目錄真麻煩。另外打包放到了Nuget上,方便下載。

https://github.com/JimLiu/Lucene.Net.Analysis.PanGu

 

另外對比了一下MMSeg和Pangu,發現各有優缺點,沒有做特別深入的比較,先用MMSeg好了。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM