做了半年的CNN算法移植,有时候需要回避一些东西,所以写的东西不能太多。简单提一下自己的总结,既是笔记,又是与网友们交流讨论。 CNN兴起,深圳这个躁动的城市很多人就想趁着这个机会捞一笔风投。于是各种基于CNN的在GPU上的demo出现后立马就成立公司,招FPGA ...
以下内容为QQ聊天整理,以及网络资料整理。本人不懂算法,如有纰漏,还请指正。 以下才是真正意义上的优化,有时候我们在面试的时候遇到招 FPGA算法优化工程师,糊弄起来,是,我们用FPGA对算法实现了优化加速,其实不是真正意义上的算法优化。但是如果你面试的时候说了实话,说自己不会做算法优化,不好意思你很可能会被立马刷下来。哈哈哈,是不是很无语。 优化方式一: 量化 通常软件里采用的是 bit 浮点 ...
2018-04-16 16:14 0 1720 推荐指数:
做了半年的CNN算法移植,有时候需要回避一些东西,所以写的东西不能太多。简单提一下自己的总结,既是笔记,又是与网友们交流讨论。 CNN兴起,深圳这个躁动的城市很多人就想趁着这个机会捞一笔风投。于是各种基于CNN的在GPU上的demo出现后立马就成立公司,招FPGA ...
这次我们来谈谈硬件架构,其实没啥好说的,就是科普的东西。因为这个玩意儿真的没啥新意 第一款:google的TPU 架构 图中DDR3仅仅是用来传 ...
这个系列的精华部分在 基于FPGA的CNN算法移植(一)概述 后面我真不知道怎么写了,再写就有泄密的风险。或者可以去讨论HLS 或者是SDsoc。 可是我真的想多做点笔记和大家一起讨论一下,思前想后就写这个吧。 这个是分析别人家公司的一个 ...
这是一篇对地平线公司产品的猜想博文,本人对地平线充满了无限的仰望和崇拜,绝无冒犯之意。因为对AI芯片设计公司感兴趣所以才分析。为何不分析别家呢? 因为4月在深圳会展中心的电子信 ...
效果,在使用了trick后,Faster R-CNN能提高1-2个百分点,而YOLOv3则提高了5个百 ...
算法设计应该满足特点:正确性、可使用性、可读性、健壮性、高效率低存储性 算法具有的特征:有限性、确定性、可行性、输入性、输出性 二叉树递归求和算法: typedef struct BNode{ int date; struct BNode* lchild, * rchild;}BTNode ...
目前,基于深度学习算法的一系列目标检测算法大致可以分为两大流派: 两步走(two-stage)算法:先产生候选区域然后进行CNN分类 R-CNN系列 R-CNN详解 Fast R-CNN详解 Faster R-CNN详解 ...
* 1 对卷积神经网络的研究可追溯到1979和1980年日本学者福岛邦彦发表的论文和“neocognition”神经网络。 * 2 AlexNet使用卷积神经网络解决图像分类问题,在ILSVR2 ...