0 - 背景
今年來卷積網絡在計算機視覺任務上取得的顯著成果,但仍然存在一些問題。去年Hinton等人提出了使用動態路由的新型網絡結構——膠囊網絡來解決卷積網絡的不足,該新型結構在手寫體識別以及小圖像分類上取得了不錯的效果。其成功的原因在於它使用了動態路由算法替代了卷積網絡中的池化層從而減少了信息的丟失並且允許捕捉數據中的部分-整體關系,同時,使用膠囊作為網絡的基本單位替代了神經元,從而使得網絡可以學習除了特征之外的更多的信息(如空間角度、大小量級、特征提取的其它屬性等)。
基於膠囊網絡的初步成功,我們第一次將其應用到圖像分割任務上,改進動態路由算法從而減少了參數,並且構造新的結構使得膠囊網絡具備了處理大圖片的能力。
1 - 貢獻
- 第一次在會議上提出將膠囊網絡應用在目標分割上面
- 在原先的動態路由算法上提出了兩個改進
- 子膠囊只能在一個定義的本地窗口路由到父膠囊
- 網絡中同一類型的膠囊的轉換矩陣共享
- 可以處理大尺度圖片(512×512),之前的膠囊網絡結構最大處理32×32大小的圖片
- 我們介紹了“deconvolutional”膠囊的概念並且提出了一個新穎的deep convolutional-deconvolutional膠囊網絡架構
- SegCaps在LIDC-IDRI數據集的LUNA16子集上的肺部分割效果有所提升
2 - 整體思路

2.1 - 動態路由算法改進
Hinton提出的原始的膠囊網絡中,膠囊間的路由相當於做一個全連接映射,每一條路由路徑都需要上一層膠囊和下一層膠囊的所有維度的全連接映射,從而使得參數量特別大,可以用如下圖解直觀解釋。

而這篇論文中,作者提出在映射的時候,通過窗口控制和同一膠囊(同一類型膠囊)共享權重的方法,減少參數,其實可以理解為,在底層的每一個膠囊內做卷積,每一個膠囊都卷出與高層的所有膠囊維度相同的張量,而后對於每一個底層膠囊卷出來的結果做路由選擇(更新耦合系數$c_{ij}$),通過下圖進行直觀理解。

3 - 實驗
參數少,效果好!

4 - 結論
- 提出了用於目標分割的新穎的深度學習模型——SegCaps,在具有挑戰性的肺部CT圖像分割數據集上效果很好(參數少,效果好)
- 改進了膠囊網絡原本的動態路由算法使得參數量大大較少並且增大了允許接受的輸入圖片的尺度
- 提出膠囊反卷積層,從而構造新穎的膠囊卷積-膠囊反卷積的架構
- 擴展了目標類的掩碼重構作為分割問題的正則化策略
5 - 參考資料
https://github.com/lalonderodney/SegCaps(論文源碼)
