該算法是描述一類圖像分類問題,它有如下特點:
如圖,主動脈弓和心臟,綠色部分相同,而黃色部分不同。傳統的CNN算法,區分效果不佳。在Multi-Instance Multi-Stage Deep Learning for Medical Image Recognition這篇文章中,作者針對這種場景提出了解決方法。
訓練:將整張片子切分成patches,每個patch的label與整片的label相同,將這些patches放入CNN分類器訓練,在反向傳播時,通過修改損失函數:每個片子中對自己類別相應最高的patch才會貢獻。如下L1是標准CNN的損失函數,L2是PCNN的損失函數:
這樣訓練出的網絡,就會對有區分度的patch敏感,而對無區分度的無感。
在該人造數據集上,PCNN取得了完美的效果
在CT數據集上,也取得了很大提高。
我體會作者設計這個算法的流程是:
一、通用算法在特定數據集上效果不完美,作者思考其中的痛點,並嘗試提出新算法來針對性解決。
二、設計一個人造數據集,驗證新算法能完美解決這個痛點。
三、最終雖然對實際數據集有較大提升,但依然不能像人造數據集一樣達到完美,是因為實際數據集還有別的痛點。