这次我们来谈谈硬件架构,其实没啥好说的,就是科普的东西。因为这个玩意儿真的没啥新意 第一款:google的TPU 架构 图中DDR3仅仅是用来传 ...
做了半年的CNN算法移植,有时候需要回避一些东西,所以写的东西不能太多。简单提一下自己的总结,既是笔记,又是与网友们交流讨论。 CNN兴起,深圳这个躁动的城市很多人就想趁着这个机会捞一笔风投。于是各种基于CNN的在GPU上的demo出现后立马就成立公司,招FPGA工程师或者ARM 等嵌入式工程师,希望通过他们进行产品落地。毕竟GPU功耗高,散热不好,价格不便宜。于是有些公司招聘FPGA工程师,就 ...
2018-03-15 10:28 0 6347 推荐指数:
这次我们来谈谈硬件架构,其实没啥好说的,就是科普的东西。因为这个玩意儿真的没啥新意 第一款:google的TPU 架构 图中DDR3仅仅是用来传 ...
这个系列的精华部分在 基于FPGA的CNN算法移植(一)概述 后面我真不知道怎么写了,再写就有泄密的风险。或者可以去讨论HLS 或者是SDsoc。 可是我真的想多做点笔记和大家一起讨论一下,思前想后就写这个吧。 这个是分析别人家公司的一个 ...
以下内容为QQ聊天整理,以及网络资料整理。本人不懂算法,如有纰漏,还请指正。 以下才是真正意义上的优化,有时候我们在面试的时候遇到招 FPGA算法优化工程师,糊弄起来,是,我们用FPGA对算法实现了优化加速,其实不是真正意义上的算法优化 ...
这是一篇对地平线公司产品的猜想博文,本人对地平线充满了无限的仰望和崇拜,绝无冒犯之意。因为对AI芯片设计公司感兴趣所以才分析。为何不分析别家呢? 因为4月在深圳会展中心的电子信 ...
网上对于FPGACNN加速的研究已经很多了,神经网络的硬件加速似乎已经满大街都是了,这里我们暂且不讨论谁做的好谁做的不好,我们只是根据许许多多的经验来总结一下实现硬件加速,需要哪些知识,考虑哪些因素。 很多人都说在做FPGA的神经网络加速,可是有多少人真正拿出了实际结果,可能大部分人 ...
目标反射回波检测算法及其FPGA实现之一:算法概述 前段时间,接触了一个声呐目标反射回波检测的项目。声呐接收机要实现的核心功能是在含有大量噪声的反射回波中,识别出发射机发出的激励信号的回波。我会分几篇文章分享这个基于FPGA的回波识别算法的开发过程和原码,欢迎大家不吝赐教。以下原创内容 ...
经典的CNN网络模型概述 接下来几天,将把自己最近读的关于图片分类的经典网络模型论文整理一遍。大概做个摘要。这些论文都是在imagenet上1.2 million数据训练出来的。 由于从这些预训练的网络训练的deep feature有良好的泛化能力,可以应用到 ...
一、概述 以太网(Ethernet)数据帧的长度必须在46-1500字节之间,这是由以太网的物理特性决定的. 这个1500字节被称为链路层的MTU(最大传输单元). 在实际使用中,单次UDP报文传输的数据量有可能会大于1500字节,因此需要用到UDP分片技术 二、UDP分片 (1)UDP封装 ...