《基於深度學習的圖像語義分割方法綜述》閱讀理解


 
近年來,深度學習技術已經廣泛應用到圖像語義分割領域.主要對 基於深度學習的圖像語義分割的經典方法 與研究現狀進行分類、梳理和總結.根據分割特點和處理粒度的不同,將基於深度學習的圖像語義分割方法分 基於區域分類的圖像語義分割方法 基於像素分類的圖像語義分割方法 .把基於像素分類的圖像語義分割方法 進一步細分為 全監督學習圖像語義分割方法 弱監督學習圖像語義分割方法 .對每類方法的代表性算法進行了分 析介紹,並詳細總結了每類方法的基本思想和優缺點,系統地闡述了深度學習對圖像語義分割領域的貢獻.對圖像語 義分割相關實驗進行了分析對比,並介紹了圖像語義分割實驗中常用公共數據集和性能評價指標.最后,預測並分析 總結了該領域未來可能的研究方向及相應的發展趨勢. 
其中,文中提出:CNN RNN GAN 三者是並列的。
ISSbRC 方法取得了一定的分割效果,但也存在圖像分割精度不高和分割速度不夠快等問題,因此,一些研究者提出直接在像素級別上進行圖像語義分割,產生了基於像素分類的圖像語義分割方法。從時間上來看bPC比bRC要晚。
 
ISSbPC 方法利用 DNN 從帶有大量標注的圖像數據中提取出圖像特征和語義信息,再根據這些信息來學習、推理原始圖像中像
素的類別,通過端到端訓練的方式對每個像素進行分類,以像素分類的方式達到語義分割的目標.這是下一步研究方向。
 
 
ENet 在執行分割任務時采用分解濾波器策略,使用低階近似(low-rank approximation) 將卷積操作分解為更簡單的操作,在保證分割精度的同時,顯著降低了計算量,是一種可完成像素標注、場景解 析等任務的實時分割網絡.ENet 中編碼部分的網絡比解碼部分復雜很多,是一種不對稱的編碼器-解碼器結構。這個重點關注。
 
關注以下兩個數據集:
Karlsruhe Institute of Technology and Toyota Technological Institute(KITTI)
.KITTI 是目前國際上用 於自動駕駛場景檢測的最大評測數據集,主要用於評測車載環境下路面分割、目標檢測、目標跟蹤 等技術.KITTI 數據集包含市區、鄉村和高速公路等真實場景圖像,每張圖像中含有不同程度的遮擋 現象. 
Cityscapes Dataset(簡稱 Cityscapes) Cityscapes 主要提供無人駕駛環境下的圖像分割數據,用於評 估算法在城區場景語義理解方面的性能.Cityscapes 包含 50 個城市不同環境、不同背景、不同季節 的街道場景,提供 5 000 張精細標注的圖片、20 000 張粗略標注的圖片和 30 種標注物體. 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM