關於論文《Information Bottleneck Disentanglement for Identity Swapping》中的問題討論


  首先,這篇文章得作者是來自中科院大學的人工智能學院,研究的是換臉任務的解糾纏任務,我應該是在微軟亞洲研究院關於CVPR2021的論文預講聽過(沒記錯的話)。當時論文還沒給出下載地址,應該是6月11號以后CVPR2021公開論文后我拿到的文章,早就讀完了,一直在忙,今天就來做個總結吧!需要詳細細節的還是去看原文

1、文章的一個重要賣點是 Information Bottleneck (簡稱IB)理論,這個理論早在1999年希伯來大學教授 Tishby提出的,它的提出是作為率失真(Rate Distortion)理論的推廣。率失真理論要解決的問題是信號傳輸的問題,它給定一個在信息傳輸過程期望保存的信息率R,以及不可避免的信號失真D,用率失真函數R(D)的方式來衡量信號的傳輸。然而率失真理論一個很大的弊端就在於針對不同的任務不好定義率失真函數,這也一直是在努力的方向

  這篇論文的方法看起來還是非常符合國內一貫的研究路線,非常的復雜交錯。論文上寫的結果還是不錯的,不知道各位實際復現的怎么樣,但從作者給出的圖片肯定是實現了非常好的人臉交換。不過從我與作者(高格格)的郵件請教過程中,發現論文是有兩個問題的,第一個問題得到了作者的回答,第二個問題當我再次問的時候,作者沒有回答,希望各位讀者一起解答一下,是論文錯誤還是我理解不對!

1、作者提到的筆誤問題,發生在公式(15)的上面段落,段落中的P^t_i是筆誤,應該寫成A^t_i,這個是作者回應了。

 

2、關於公式(4)中 Z 的分布計算,那個方差沒看明白,兩個正態分布線性疊加,總的方差前面不應該是系數的平方和嘛?為啥文章寫的是1?這里沒搞明白。

 

 

 

作者的回答如下:

“給定一張圖片,R_i取值固定(預訓練網絡固定),Z_i的方差來自 varepsilon_i,Z_i|R_i同理;”

按照作者的理解思路,我又提了第二次問題,但是沒得到作者的回答,問題如下:

“2、問題二還是不明白,如果按R_i是固定的來說,那么Z_i的分布不就和Z_i|R_i的分布一樣了嗎?我的理解就是知道R_i的情況下求Z_i的分布,那么就把R_i當成常數就好,這樣子Z_i的概率和他的條件概率感覺就是一樣的了.......”

郵件發了兩次作者一直沒回,希望各位讀者有見解的也能一起討論一下,因為一旦這個Z_i計算有誤的話這篇文章后面的很多部分都是有問題。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM