花費 43 ms
.net 下如何將文檔文件(Word, Pdf等) 中的文本提取出來

經常有人問我怎么將類似word,pdf這樣的文檔轉換為文本然后索引,.net 這方面的解決方案不是很多,為了方便大家,我花了一天時間自己做了一個。 Java 版本的 lucence 提供了一個 ti ...

Thu Jan 10 18:44:00 CST 2013 59 12395
HubbleDotNet 的注冊碼生成器

從上次更新HubbletDotNet 到現在一晃3年多了。2012年我所在的公司被澳洲電信收購,從此我就變得特別忙,沒有時間繼續 HubbleDotNet 的開發和維護,非常非常的抱歉。 Hubbl ...

Wed Sep 30 05:07:00 CST 2015 17 4045
HubbleDotNet 索引分詞的測試方法和分詞技巧

在中文搜索中,分詞技術是一個比較關鍵的技術,我們往往會遇到查詢某個關鍵字無法匹配到相應文檔的問題,這種問題往往都是索引的分詞不理想造成的,倒排索引的技術特點決定了如果查詢的關鍵字不在索引的分詞中,則無 ...

Wed Feb 15 17:27:00 CST 2012 13 7293

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM