自回歸(auto-regression)機制
在每個新單詞產生后,該單詞就被添加在之前生成的單詞序列后面,這個序列會成為模型下一步的新輸入。這種機制叫做自回歸(auto-regression),同時也是令 RNN 模型效果拔群的重要思想。 GPT-2,以及一些諸如 TransformerXL 和 XLNet 等后續出現的模型,本質上都是 ...
在每個新單詞產生后,該單詞就被添加在之前生成的單詞序列后面,這個序列會成為模型下一步的新輸入。這種機制叫做自回歸(auto-regression),同時也是令 RNN 模型效果拔群的重要思想。 GPT-2,以及一些諸如 TransformerXL 和 XLNet 等后續出現的模型,本質上都是 ...