Learning to Cartoonize Using White-box Cartoon Representations


這篇論文把圖像卡通化分解成所謂的“白盒”。代碼開源。就是之前的方案是一股腦梭哈,原圖和風格圖扔到網絡里然后通過約束特征也好或其他操作輸出風格后的圖像。這篇工作把這一過程分解,使得可控。具體分解如下:

原圖和風格圖操作時分為三個模塊:surface表征、structure表征、texture表征。

先上結構圖,然后分別分析三個模塊:

第一個模塊:Learning From the Surface Representation

顧名思義,結合圖1看,這個表征主要是粗表征,平滑圖像也仍保持全局語義結構,但是細節不保留。這塊用到一個判別器,公式如下:

很好理解,就是原圖和生成的卡通圖像。

 

第二個模塊:Learning From the Structure representation

這個模塊的作用估計全局內容,邊界等首先利用felzenszwalb(超像素)算法分割圖像為分離的區域,然后利用selective search來合並一些區域,因為超像素沒有考慮語義。

這里沒判別器,利用vgg特征來約束。 

 

第三個模塊:Learning From the Textural representation

這部分是高頻特征,即圖像內容信息,但是要減少色彩影響,於是對rgb三通道進行加權操作:

這里有用到了另一個判別器:

 

 整體而言,動機明確,此時也發現一些paper的思路:耦合或者解耦。只要合理work就是一個值得研究的方法。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM