實現nlp文本生成中的beam search解碼器

本文轉載自查看原文 2018-07-19 14:36 4607

自然語言處理任務，比如caption generation（圖片描述文本生成）、機器翻譯中，都需要進行詞或者字符序列的生成。常見於seq2seq模型或者RNNLM模型中。

這篇博文主要介紹文本生成解碼過程中用的greedy search 和beam search算法實現。其中，greedy search 比較簡單，着重介紹beam search算法的實現。

我們在文本生成解碼時，實際上是想找對最有的文本序列，或者說是概率，可能性最大的文本序列。而要在全局搜索這個最有解空間，往往是不可能的（因為詞典太大），建設生成序列長度為N，詞典大小為V，則復雜度為 V^N次方。這實際上是一個NP難題。退而求其次，我們使用啟發式算法，來找到可能的最優解，或者說足夠好的解。

假設序列數據（假設每個位置詞的概率都已經給出）：

data = [[0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1]]
data = array(data)

1、greedy search decoder

非常簡單，我們用argmax就可以實現

# greedy decoder
def greedy_decoder(data):
    # 每一行最大概率詞的索引
    return [argmax(s) for s in data]

完整代碼

from numpy import array
from numpy import argmax

# greedy decoder
def greedy_decoder(data):
    # 每一行最大概率詞的索引
    return [argmax(s) for s in data]

# 定義一個句子，長度為10，詞典大小為5
data = [[0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1]]
data = array(data)
# 使用greedy search解碼
result = greedy_decoder(data)
print(result)

2. beam search

與greedy search不同，beam search返回多個最有可能的解碼結果（具體多少個，由參數k執行）。

greedy search每一步都都采用最大概率的詞，而beam search每一步都保留k個最有可能的結果，在每一步，基於之前的k個可能最優結果，繼續搜索下一步。（參考下面示意圖理解）

示例圖（設置返回解碼結果為2個）：

from math import log
from numpy import array
from numpy import argmax

# beam search
def beam_search_decoder(data, k):
    sequences = [[list(), 1.0]]
    for row in data:
        all_candidates = list()
        for i in range(len(sequences)):
            seq, score = sequences[i]
            for j in range(len(row)):
                candidate = [seq + [j], score * -log(row[j])]
                all_candidates.append(candidate)
        # 所有候選根據分值排序
        ordered = sorted(all_candidates, key=lambda tup:tup[1])
        # 選擇前k個
        sequences = ordered[:k]
    return sequences

# 定義一個句子，長度為10，詞典大小為5
data = [[0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1],
        [0.1, 0.2, 0.3, 0.4, 0.5],
        [0.5, 0.4, 0.3, 0.2, 0.1]]
data = array(data)
# 解碼
result = beam_search_decoder(data, 3)
# print result
for seq in result:
    print(seq)

相關資料：

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 LSTM實現文本生成基於seq2seq文本生成的解碼/采樣策略 CTC 解碼算法之 prefix beam search 基於LSTM模型實現文本生成視頻流GPU解碼在ffempg的實現（二）-GPU解碼器 PPM解碼器 LSTM文本生成(二) 【NLP】選擇目標序列：貪心搜索和Beam search nlp四大任務(分類、匹配、序列標注、文本生成)集成項目 netty系列之:netty中的懶人編碼解碼器