1.對抗攻擊概念介紹

本文轉載自查看原文 2019-03-28 13:14 5983 對抗攻擊算法

對抗攻擊概念：

　　通過對輸入添加微小的擾動使得分類器分類錯誤，一般對用於深度學習的網絡的攻擊算法最為常見，應用場景包括目前大熱的CV和NLP方向，例如，通過對圖片添加精心准備的擾動噪聲使得分類器分錯，或者通過對一個句子中的某些詞進行同義詞替換使得情感分類錯誤。

對抗攻擊分類：

　　關於攻擊的分類有很多種，從攻擊環境來說，可以分為黑盒攻擊，白盒攻擊或者灰盒攻擊：

　　黑盒攻擊：攻擊者對攻擊的模型的內部結構，訓練參數，防御方法（如果加入了防御手段的話）等等一無所知，只能通過輸出輸出與模型進行交互。
　　白盒攻擊：與黑盒模型相反，攻擊者對模型一切都可以掌握。目前大多數攻擊算法都是白盒攻擊。
　　灰盒攻擊：介於黑盒攻擊和白盒攻擊之間，僅僅了解模型的一部分。（例如僅僅拿到模型的輸出概率，或者只知道模型結構，但不知道參數）
從攻擊的目的來說，可以分為有目標攻擊和無目標攻擊：
無目標攻擊：以圖片分類為例，攻擊者只需要讓目標模型對樣本分類錯誤即可，但並不指定分類錯成哪一類。
有目標攻擊：攻擊者指定某一類，使得目標模型不僅對樣本分類錯誤並且需要錯成指定的類別。從難度上來說，有目標攻擊的實現要難於無目標攻擊。

　從擾動的強度大小來說，可以分為無窮范數攻擊，二范數攻擊和0范數攻擊（下列公式中的x表示的是擾動大小）:

從攻擊的實現來說來說，可以分為基於梯度的攻擊，基於優化的攻擊，基於決策面的攻擊或者其他:

基於梯度的攻擊： FGSM（Fast Gradient Sign Method)　　PGD(Project Gradient Descent)　　MIM(Momentum Iterative Method)
基於優化的攻擊： CW(Carlini-Wagner Attack)
基於決策面的攻擊： DEEPFOOL
其他：Pointwise

對抗攻擊實現工具：

　　目前來說，比較主流的工具有cleverhans,foolbox,另外筆者還發現了一個advertorch,專門針對pytorch模型。

（當然這個難易程度是筆者自己分的，見仁見智了~~~）

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 1.驅動程序概念介紹對抗攻擊(一) FGSM 深度學習中的對抗攻擊和對抗防御對抗樣本攻擊及防御實戰攻擊對抗基礎知識如何使用Nginx對抗DDoS攻擊？【趣事】用 JavaScript 對抗 DDOS 攻擊對抗攻擊方法一覽對抗攻擊領域綜述（adversarial attack） 6 15種對抗攻擊的防御方法