花費 9 ms
基於統計的無詞典的高頻詞抽取(一)——后綴數組字典序排序

中文全文檢索中很重要的一個環節就是分詞,而一般分詞都是基於字典的,特別是對於特定的業務,需要從特定的語料庫中抽出高頻有意義的詞來生成字典。這系列文章,就一步一步來實現一個從大規模語料庫正抽取出高頻詞的 ...

Sat Jun 15 07:00:00 CST 2013 5 1563

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM