这个系列的精华部分在 基于FPGA的CNN算法移植(一)概述 后面我真不知道怎么写了,再写就有泄密的风险。或者可以去讨论HLS 或者是SDsoc。 可是我真的想多做点笔记和大家一起讨论一下,思前想后就写这个吧。 这个是分析别人家公司的一个 ...
这次我们来谈谈硬件架构,其实没啥好说的,就是科普的东西。因为这个玩意儿真的没啥新意 第一款:google的TPU 架构 图中DDR 仅仅是用来传送数据量小的权重,因为DDR 的速度实在是跟不上啊。而激活值采用 GiB S 的速度传入和传出,中间那个矩阵乘法器是 个 ,运算力相当野蛮吧。中间就是一些控制逻辑 不同层控制不同,还有就是一些为了保障速度的辅助逻辑。 第二款: 深鉴科技的DPU 由上面的 ...
2018-03-15 11:51 0 2048 推荐指数:
这个系列的精华部分在 基于FPGA的CNN算法移植(一)概述 后面我真不知道怎么写了,再写就有泄密的风险。或者可以去讨论HLS 或者是SDsoc。 可是我真的想多做点笔记和大家一起讨论一下,思前想后就写这个吧。 这个是分析别人家公司的一个 ...
做了半年的CNN算法移植,有时候需要回避一些东西,所以写的东西不能太多。简单提一下自己的总结,既是笔记,又是与网友们交流讨论。 CNN兴起,深圳这个躁动的城市很多人就想趁着这个机会捞一笔风投。于是各种基于CNN的在GPU上的demo出现后立马就成立公司,招FPGA ...
以下内容为QQ聊天整理,以及网络资料整理。本人不懂算法,如有纰漏,还请指正。 以下才是真正意义上的优化,有时候我们在面试的时候遇到招 FPGA算法优化工程师,糊弄起来,是,我们用FPGA对算法实现了优化加速,其实不是真正意义上的算法优化 ...
这是一篇对地平线公司产品的猜想博文,本人对地平线充满了无限的仰望和崇拜,绝无冒犯之意。因为对AI芯片设计公司感兴趣所以才分析。为何不分析别家呢? 因为4月在深圳会展中心的电子信 ...
一、CORDIC算法 CORDIC(Coordinate Rotation DIgital Computer)是一种通过迭代实现快速平面旋转的算法,通过变形扩展,它可以对多种超越函数求值,例如三角/反三角函数、双曲函数等。 对超越函数求值,常见方法为用多项式近似,例如利用泰勒展开来逼近 ...
网上对于FPGACNN加速的研究已经很多了,神经网络的硬件加速似乎已经满大街都是了,这里我们暂且不讨论谁做的好谁做的不好,我们只是根据许许多多的经验来总结一下实现硬件加速,需要哪些知识,考虑哪些因素。 很多人都说在做FPGA的神经网络加速,可是有多少人真正拿出了实际结果,可能大部分人 ...
FPGA市场占有率最高的两大公司Xilinx和Altera。 查找表(Look-Up-Table)简称为LUT,LUT本质上就是一个RAM。目前FPGA中多使用4输入的LUT,所以每一个LUT可以看成一个有4位地址线的 的RAM。 当用户通过原理图或HDL语言描述了一个逻辑电路以后,PLD ...
本文设计方式采用明德扬至简设计法。利用FPGA来完成显示功能不是个很理想的方式,当显示任务比较复杂,要通过各种算法显示波形或者特定图形时,当然要用单片机通过C语言完成这类流程控制复杂,又对时序要求不高的任务(这也坚定了我学习SOPC的决心)。但要驱动如LCD1602/LCD12864打印 ...