花费 6 ms
.net 下如何将文档文件(Word, Pdf等) 中的文本提取出来

经常有人问我怎么将类似word,pdf这样的文档转换为文本然后索引,.net 这方面的解决方案不是很多,为了方便大家,我花了一天时间自己做了一个。 Java 版本的 lucence 提供了一个 ti ...

Thu Jan 10 18:44:00 CST 2013 59 12395
HubbleDotNet 的注册码生成器

从上次更新HubbletDotNet 到现在一晃3年多了。2012年我所在的公司被澳洲电信收购,从此我就变得特别忙,没有时间继续 HubbleDotNet 的开发和维护,非常非常的抱歉。 Hubbl ...

Wed Sep 30 05:07:00 CST 2015 17 4045
HubbleDotNet 索引分词的测试方法和分词技巧

在中文搜索中,分词技术是一个比较关键的技术,我们往往会遇到查询某个关键字无法匹配到相应文档的问题,这种问题往往都是索引的分词不理想造成的,倒排索引的技术特点决定了如果查询的关键字不在索引的分词中,则无 ...

Wed Feb 15 17:27:00 CST 2012 13 7293

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM