Fork版本項目地址:SSD 一、損失函數介紹 SSD損失函數分為兩個部分:對應搜索框的位置loss(loc)和類別置信度loss(conf)。(搜索框指網絡生成的網格) 詳細的說明如下: i指代搜索框序號,j指代真實框序號,p指代類別序號,p=0表示背景, 中取1表示此時第i個搜索框 ...
Fork版本項目地址:SSD 上一節中我們定義了vgg 的網絡結構,實際使用中還需要匹配SSD另一關鍵組件:被選取特征層的搜索網格。在項目中,vgg 網絡和網格生成都被統一進一個class中,我們從class SSDNet開始談起。 一 初始化class SSDNet 這是SSDNet的初始化部分,這一部分的內容在上一節都提到過了:網絡超參數定義 amp 初始化vgg 網絡結構並更新feat sh ...
2018-07-17 11:05 2 3532 推薦指數:
Fork版本項目地址:SSD 一、損失函數介紹 SSD損失函數分為兩個部分:對應搜索框的位置loss(loc)和類別置信度loss(conf)。(搜索框指網絡生成的網格) 詳細的說明如下: i指代搜索框序號,j指代真實框序號,p指代類別序號,p=0表示背景, 中取1表示此時第i個搜索框 ...
Fork版本項目地址:SSD 一、輸入標簽生成 在數據預處理之后,圖片、類別、真實框格式較為原始,不能夠直接作為損失函數的輸入標簽(ssd向前網絡只需要圖像就行,這里的處理主要需要滿足loss的計算),對於一張圖片(三維CHW)我們需要如下格式的數據作為損失函數標簽: gclasse ...
Fork版本項目地址:SSD 作者使用了分布式訓練的寫法,這使得訓練部分代碼異常臃腫,我給出了部分注釋。我對於多機分布式並不很熟,而且不是重點,所以不過多介紹,簡單的給出一點訓練中作者的優化手段,包含優化器選擇之類的。 一、滑動平均 # =================================================================== ...
Fork版本項目地址:SSD 參考自集智專欄 一、SSD基礎 在分類器基礎之上想要識別物體,實質就是 用分類器掃描整張圖像,定位特征位置 。這里的關鍵就是用什么算法掃描,比如可以將圖片分成若干網格,用分類器一個格子、一個格子掃描,這種方法有幾個問題: 問題1 : 目標正好 ...
Fork版本項目地址:SSD 一、數據格式介紹 數據文件夾命名為VOC2012,內部有5個子文件夾,如下, 我們的檢測任務中使用JPEGImages文件夾和Annotations文件夾。 JPEGImages文件夾中包含了PASCAL VOC所提供的所有的圖片信息,包括了訓練圖片和測試 ...
一、RPN錨框信息生成 上文的最后,我們生成了用於計算錨框信息的特征(源代碼在inference模式中不進行錨框生成,而是外部生成好feed進網絡,training模式下在向前傳播時直接生成錨框,不過實際上沒什么區別,錨框生成的講解見『計算機視覺』Mask-RCNN_錨框生成 ...
一、論文介紹 讀論文系列:Object Detection ECCV2016 SSD 一句話概括:SSD就是關於類別的多尺度RPN網絡 基本思路: 基礎網絡后接多層feature map 多層feature map分別對應不同尺度的固定anchor 回歸所有anchor對應 ...
Fork版本項目地址:SSD 一、TFR數據讀取 創建slim.dataset.Dataset對象 在train_ssd_network.py獲取數據操作如下,首先需要slim.dataset.Dataset對象 # Select the dataset. # 'imagenet ...