最近工作上需要做句子語義去重相關的工作,本質上這是屬於NLP中text matching(文本匹配)相關的內容。因此我花了一些時間整理了一些關於這個方向的資料,整理如下(也許會持續更新):
- BiMPM: https://weibo.com/1402400261/F40cs8tIX?type=comment#_rnd1563284472799
- 文本匹配的綜述: https://blog.csdn.net/xiayto/article/details/81247461
- 知乎:如何判斷兩個文本說的是同一件事情? https://www.zhihu.com/question/56751077
- https://engineering.quora.com/Semantic-Question-Matching-with-Deep-Learning
- https://www.kaggle.com/quora/question-pairs-dataset(quroa 在kaggle上舉辦的title 語義去重的比賽)
- 螞蟻金服文本語義相似度比賽:
官方地址: https://dc.cloud.alipay.com/index?click_from=MAIL&_bdType=acafbbbiahdahhadhiih#/topic/intro?id=3
選手代碼解析:https://blog.csdn.net/u014732537/article/details/81038260
- 知乎,papers of text matching:
https://zhuanlan.zhihu.com/p/27441587
https://zhuanlan.zhihu.com/p/27443681
- matchzoo: 用於 text match 的 統一集成框架,github地址:https://github.com/NTMC-Community/MatchZoo
- awesome-neural-models-for-semantic-match(一系列的文本語義匹配paper & code):https://github.com/NTMC-Community/awesome-neural-models-for-semantic-match