花费 6 ms
基于统计的无词典的高频词抽取(一)——后缀数组字典序排序

中文全文检索中很重要的一个环节就是分词,而一般分词都是基于字典的,特别是对于特定的业务,需要从特定的语料库中抽出高频有意义的词来生成字典。这系列文章,就一步一步来实现一个从大规模语料库正抽取出高频词的 ...

Sat Jun 15 07:00:00 CST 2013 5 1563

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM