文本摘要生成方法

本文轉載自查看原文 2019-12-04 17:36 974 python/ Deep Learning

最近在搞聊天數據分析，對文本摘要有需求，學習一下該方法。

一、文本摘要(Document Summarization)

文本摘要，一般地我們會把它分成抽取式文本摘要和生成式文本摘要。就目前的形勢而言，工業界應用廣泛的還是抽取式文本摘要。抽取式文本摘要的優點很多，主題不易偏離、適應性廣、速度快。

抽取式文本摘要，最最傳統的方案，無疑便是Lead3算法了。

github如下:https://github.com/yongzhuo/nlg-yongzhuo/tree/master/nlg_yongzhuo/text_summarization/extractive_sum/nous_base

二、Lead3

Lead3，顧名思義，就是最開始的3個句子，很有意思，就這一個超級簡單的算法，就能達到很好的效果，例如bertsum中的測評結果，已經接近Transformer了:

我代碼獲取的是top2以及最后1句。

代碼地址: https://github.com/yongzhuo/nlg-yongzhuo/blob/master/nlg_yongzhuo/text_summarization/extractive_sum/nous_base/lead_3/lead_3.py

三、keyword

keyword，包括word_significance，思想是抽取最有意義的詞語。把關鍵詞和句子順序兩盒起來，具體就是先遍歷關鍵詞，再順序遍歷句子，直到找到出現的第一個句子，然后刪掉該句子，繼續遍歷。

代碼地址:https://github.com/yongzhuo/nlg-yongzhuo/blob/master/nlg_yongzhuo/text_summarization/extractive_sum/feature_base/word_significance%20.py

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 ipa生成方法 BERT生成文本摘要 AAR 生成方法生成方法和判別方法 linux密鑰生成方法 Facebook KeyHash生成方法 matlab諧波生成方法隨機姓名生成方法深度學習--文本摘要生成簡介文本摘要生成（seq2seq)