注意力機制
注意力模型也稱資源分配模型,它借鑒了人類的選擇注意力機制,其核心思想是對目標數據進行加權變換。
截止到目前,嘗試過的注意力機制,要么是
(1)基於時間步的注意力機制
(2)基於維度的注意力機制(大佬魔改)
都是用於多維數據處理的
在一篇論文中,提到了針對一維向量的注意力機制:Attention本質就是給不同特征給予不同的注意程度,也就是權重分配
該文獻中,使用的是相關性系數
Feature_Value = corr * Feature_Value
實現權重的重新分配,從而實現給不同的特征給予不同的重視程度
以上,是目前接觸到的注意力機制應用方向,包括:
- 針對多維數據的基於時間步的注意力機制
- 針對多維數據的基於維度的注意力機制
- 針對一維數據的注意力機制(權重分配)
以下,是學習過程中使用的一些精品博客,代碼基本都運行過
【注意力參考博客】
https://blog.csdn.net/qq_35649669/article/details/103807915
這是這位大佬的實戰
https://blog.csdn.net/qq_35649669/article/details/104793484
【注意力項目地址】
這個是大佬參考的大佬代碼,但貌似發生了更新,繪圖部分程序跑不出來(基於時間步的注意力機制),主要程序沒有任何問題
https://github.com/philipperemy/keras-attention-mechanism
這個是大佬的代碼(作者進行了改進,實現了 基於維度的注意力機制)
https://github.com/PatientEz/keras-attention-mechani
【keras實現注意力機制】
啟蒙博客+項目,程序親試可以運行,就是改起來相當費勁,針對多維數據
https://www.cnblogs.com/lunge-blog/p/11496287.html
https://github.com/Choco31415/Attention_Network_With_Keras
【注意力其他博客】
https://mlln.cn/2018/09/02/keras%E6%95%99%E7%A8%8B-n-%E5%BE%AA%E7%8E%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%E7%9A%84%E6%B3%A8%E6%84%8F%E5%8A%9B%E6%9C%BA%E5%88%B6%E7%9A%84%E7%90%86%E8%AE%BA%E5%92%8C%E5%AE%9E%E7%8E%B0/
https://www.freesion.com/article/6186223004/