Inf-Net: Automatic COVID-19 Lung Infection Segmentation from CT Images


1  問題描述

對COVID-19的研究面臨的挑戰有:感染區域特征的高變異性(CT切片中感染的紋理、大小和位置變化較大,對檢測具有挑戰性);感染與正常組織之間的低強度對比(類間方差很小);數據量小導致訓練困難。

論文提出Inf-Net從肺部CT圖片中自動分割感染區域。其中,並行部分解碼器(PPD)用於聚合高級特征(結合上下文信息)並生成全局圖。然后,利用隱式逆向注意力(RA)和顯示邊緣注意力對邊界進行建模和增強表征。此外,為了緩解標記數據不足的問題,我們提出了一種基於隨機選擇傳播策略的半監督分割框架,該框架只需要少量標記圖像,主要利用未標記數據。

在COVID-SemiSeg和真實CT體積上進行廣泛實驗表明,Inf-Net性能優於大多數尖端分割模型,並提高了當前的性能水平。

作者指出其動機源於臨床醫生在肺部感染檢測過程中,首先對感染區域進行粗略定位,然后根據局部症狀准確提取其輪廓。因此,我們認為區域和邊界是區分正常組織和感染的兩個關鍵特征。因此,我們的網絡首先預測粗糙區域(PPD),然后通過反向注意和邊界約束引導隱式建模邊界,顯式增強邊界識別。

2  內容介紹

2.1 Inf-Net結構

圖1 模型結構

    具體流程:CT圖像首先被送入兩個卷積層,以提取高分辨率,語義薄弱(低級)特性。在此,我們增加了邊緣注意模塊(EA)來明確地改善目標區域邊界的表示。然后將f2得到的低層特征饋入三個卷積層,提取高層特征,用於兩個目的。首先,我們利用並行部分解碼器(PPD)來聚合這些特征,並生成一個肺部感染的粗略定位的全球地圖Sg。其次,這些特征結合f2在Sg的指導下被饋給多個反向注意(RA)模塊。值得注意的是,RA模塊是以級聯的方式組織的。如圖1所示,R4依賴於另一個RA R5的輸出。最后一個RA的輸出,即S3被輸入sigmoid函數,用於最終預測肺部感染區域。接下來詳細介紹網絡的關鍵組成部分和損失函數。

EA:

低層特征保留有邊緣信息,選用f2,將特征f2通過一個過濾器被提供給卷積層來產生邊緣映射,用標准二元交叉熵損失(BCE)計算生成的邊緣映射和由真值(GT)導出的邊緣映射Ge的相異度。

 

Paralleled partial decoder(PPD):

圖2 平行部分解碼器

用並行部分解碼器只聚合high-level的特征。對於輸入的CT圖像I,我們首先使用Res2Net的前5個卷積塊提取兩組底層特征{fi, i = 1,2}和三組高級特征{fi, i = 3,4,5}。然后利用部分解碼器pd(.),以並行連接聚合高層特征。部分解碼器生成一個粗略的全局映射Sg = pd(f3, f4, f5),作為RA模塊中的全局指導。

Reverse Attention Module

圖3 逆向注意力模塊

臨床醫生通常采用兩步方法對肺部感染區域進行分段,先粗略定位感染區域,然后通過檢查局部組織結構對感染區域進行准確標記。我們的架構可以依次利用互補區域和細節,方法是從高級副輸出特征(side-outputs,即Si)中刪除估計的感染區域。具體流程為:

首先融合{fi, i = 3,4,5}和eatt = f2的特征, RA的權重為Ai。

其中,Dow為下采樣,C(.)為concat操作。權重Ai在顯著目標檢測方面具有實際意義,定義為:

 

其中P為下采樣操作,然后使用Sigmoid函數,再使用從矩陣E中減去輸入的反向運算。符號 表示將一個單通道特征擴展到64個重復張量,其中包括對候選張量的每個通道進行反轉。值得注意的是,由RA驅動的刪除策略最終可以將不精確和粗糙的估計細化為准確和完整的預測圖。

Loss Function: 在邊緣監督上提出了損失函數Lseg,由IOU和BCE加權計算得到,其中權重系數設置為1。不同於一般的IoU,這里設計的帶有權重的IoU和BCE提高了難分像素(hard pixel)的比重,而不是給所有像素分配相等的權重。使用Correntropy-induced loss  Functions可以提高魯棒性。

 

最后計算了side-outputs(S3、S4、S5)與Sg的監督損失,在計算時采用了上采樣,保持梯度一致。總的損失函數定義為:

 

2.2 半監督-Inf-Net

我們使用半監督學習策略改進了info - net,該策略利用大量未標記的CT圖像來有效地擴充訓練數據集,以提高分割精度。我們使用如圖5中的算法1中描述的過程為未標記的CT圖像生成偽標簽。

圖5 偽標簽生成算法

圖6 算法框架

2.3  Extension to Multi-Class Infection Labeling

圖7  在多標簽任務中的應用

將感染分割結果和對應的CT圖像輸入一個多類分割網絡,如FCN8s或UNet。該框架可以充分利用Semi-Inf-Net提供的感染分割結果,有效提高多類感染標記的性能。

3. 實驗設置及結果

生成偽標簽:K=5,共1600張無標簽數據,batchsize=16,迭代320輪。

半監督Inf-Net

首先統一縮放到352*352,再使用不同的縮放速率(0.75, 1, 1.25)重復采樣。使用Adam學習率:設置為1e-4。訓練階段分兩步:1.在1600張偽標簽的數據集上訓練,2.在50張有標簽的數據集上微調。

數據集:共100張有標簽的圖,選擇其中45張做訓練集,5張為驗證集,50張為測試集。

評價指標:Dice、Sensitivity (Sen.), Specificity (Spec.), and Precision (Prec.)以及目標檢測中用到的Structure Measure(Sa), Enhance-alignment Measure (  ):、Mean Absolute Error(MAE),定義分別為:

其中S3 with Sigmoid function as the final prediction Sp, α = 0.5, object-aware similarity So and region-aware similarity Sr.

 

Evaluating both local and global similarity.

Measures the pixelwise error.

3.1 感染區域對比實驗及可視化結果

 

3.2 多類標記對比實驗及可視化結果

 

3.3 模塊消融實驗

該實驗證明了PPD、EA模塊對性能的提升。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM