花费 6 ms
BM25相关度打分公式

BM25算法是一种常见用来做相关度打分的公式,思路比较简单,主要就是计算一个query里面所有词和文档的相关度,然后在把分数做累加操作,而每个词的相关度分数主要还是受到tf/idf的影响。公式如下: ...

Sun Oct 19 21:12:00 CST 2014 0 16032
hanlp使用自定义词典抽取关键词

1.在data/dictionary/custom/路径下新建文件 myDict.txt.,添加新的单词,单词,词性,词频。并删除当前文件夹下的bin文件, 2.在hanlp配置文件中的Custom ...

Mon Apr 15 18:49:00 CST 2019 0 617

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM