Fork版本项目地址:SSD 一、损失函数介绍 SSD损失函数分为两个部分:对应搜索框的位置loss(loc)和类别置信度loss(conf)。(搜索框指网络生成的网格) 详细的说明如下: i指代搜索框序号,j指代真实框序号,p指代类别序号,p=0表示背景, 中取1表示此时第i个搜索框 ...
Fork版本项目地址:SSD 上一节中我们定义了vgg 的网络结构,实际使用中还需要匹配SSD另一关键组件:被选取特征层的搜索网格。在项目中,vgg 网络和网格生成都被统一进一个class中,我们从class SSDNet开始谈起。 一 初始化class SSDNet 这是SSDNet的初始化部分,这一部分的内容在上一节都提到过了:网络超参数定义 amp 初始化vgg 网络结构并更新feat sh ...
2018-07-17 11:05 2 3532 推荐指数:
Fork版本项目地址:SSD 一、损失函数介绍 SSD损失函数分为两个部分:对应搜索框的位置loss(loc)和类别置信度loss(conf)。(搜索框指网络生成的网格) 详细的说明如下: i指代搜索框序号,j指代真实框序号,p指代类别序号,p=0表示背景, 中取1表示此时第i个搜索框 ...
Fork版本项目地址:SSD 一、输入标签生成 在数据预处理之后,图片、类别、真实框格式较为原始,不能够直接作为损失函数的输入标签(ssd向前网络只需要图像就行,这里的处理主要需要满足loss的计算),对于一张图片(三维CHW)我们需要如下格式的数据作为损失函数标签: gclasse ...
Fork版本项目地址:SSD 作者使用了分布式训练的写法,这使得训练部分代码异常臃肿,我给出了部分注释。我对于多机分布式并不很熟,而且不是重点,所以不过多介绍,简单的给出一点训练中作者的优化手段,包含优化器选择之类的。 一、滑动平均 # =================================================================== ...
Fork版本项目地址:SSD 参考自集智专栏 一、SSD基础 在分类器基础之上想要识别物体,实质就是 用分类器扫描整张图像,定位特征位置 。这里的关键就是用什么算法扫描,比如可以将图片分成若干网格,用分类器一个格子、一个格子扫描,这种方法有几个问题: 问题1 : 目标正好 ...
Fork版本项目地址:SSD 一、数据格式介绍 数据文件夹命名为VOC2012,内部有5个子文件夹,如下, 我们的检测任务中使用JPEGImages文件夹和Annotations文件夹。 JPEGImages文件夹中包含了PASCAL VOC所提供的所有的图片信息,包括了训练图片和测试 ...
一、RPN锚框信息生成 上文的最后,我们生成了用于计算锚框信息的特征(源代码在inference模式中不进行锚框生成,而是外部生成好feed进网络,training模式下在向前传播时直接生成锚框,不过实际上没什么区别,锚框生成的讲解见『计算机视觉』Mask-RCNN_锚框生成 ...
一、论文介绍 读论文系列:Object Detection ECCV2016 SSD 一句话概括:SSD就是关于类别的多尺度RPN网络 基本思路: 基础网络后接多层feature map 多层feature map分别对应不同尺度的固定anchor 回归所有anchor对应 ...
Fork版本项目地址:SSD 一、TFR数据读取 创建slim.dataset.Dataset对象 在train_ssd_network.py获取数据操作如下,首先需要slim.dataset.Dataset对象 # Select the dataset. # 'imagenet ...