原文:基于FPGA的CNN算法移植(一)概述

做了半年的CNN算法移植,有时候需要回避一些东西,所以写的东西不能太多。简单提一下自己的总结,既是笔记,又是与网友们交流讨论。 CNN兴起,深圳这个躁动的城市很多人就想趁着这个机会捞一笔风投。于是各种基于CNN的在GPU上的demo出现后立马就成立公司,招FPGA工程师或者ARM 等嵌入式工程师,希望通过他们进行产品落地。毕竟GPU功耗高,散热不好,价格不便宜。于是有些公司招聘FPGA工程师,就 ...

2018-03-15 10:28 0 6347 推荐指数:

查看详情

基于FPGACNN算法移植(二)硬件架构

这次我们来谈谈硬件架构,其实没啥好说的,就是科普的东西。因为这个玩意儿真的没啥新意 第一款:google的TPU 架构 图中DDR3仅仅是用来传 ...

Thu Mar 15 19:51:00 CST 2018 0 2048
基于FPGACNN算法移植(三)软件算法架构分析

这个系列的精华部分在 基于FPGACNN算法移植(一)概述 后面我真不知道怎么写了,再写就有泄密的风险。或者可以去讨论HLS 或者是SDsoc。 可是我真的想多做点笔记和大家一起讨论一下,思前想后就写这个吧。 这个是分析别人家公司的一个 ...

Thu Mar 29 19:51:00 CST 2018 0 3290
基于FPGACNN算法移植(五)算法优化方向汇总

以下内容为QQ聊天整理,以及网络资料整理。本人不懂算法,如有纰漏,还请指正。 以下才是真正意义上的优化,有时候我们在面试的时候遇到招 FPGA算法优化工程师,糊弄起来,是,我们用FPGA算法实现了优化加速,其实不是真正意义上的算法优化 ...

Tue Apr 17 00:14:00 CST 2018 0 1720
基于FPGACNN算法移植(四)地平线等公司的 ADAS 产品

这是一篇对地平线公司产品的猜想博文,本人对地平线充满了无限的仰望和崇拜,绝无冒犯之意。因为对AI芯片设计公司感兴趣所以才分析。为何不分析别家呢? 因为4月在深圳会展中心的电子信 ...

Thu Apr 12 18:58:00 CST 2018 0 1949
FPGACNN加速,你怎么看?

网上对于FPGACNN加速的研究已经很多了,神经网络的硬件加速似乎已经满大街都是了,这里我们暂且不讨论谁做的好谁做的不好,我们只是根据许许多多的经验来总结一下实现硬件加速,需要哪些知识,考虑哪些因素。 很多人都说在做FPGA的神经网络加速,可是有多少人真正拿出了实际结果,可能大部分人 ...

Wed Jun 13 00:40:00 CST 2018 0 1724
目标反射回波检测算法及其FPGA实现 之一:算法概述

目标反射回波检测算法及其FPGA实现之一:算法概述 前段时间,接触了一个声呐目标反射回波检测的项目。声呐接收机要实现的核心功能是在含有大量噪声的反射回波中,识别出发射机发出的激励信号的回波。我会分几篇文章分享这个基于FPGA的回波识别算法的开发过程和原码,欢迎大家不吝赐教。以下原创内容 ...

Mon Aug 13 20:31:00 CST 2018 2 1208
经典的CNN网络模型概述

经典的CNN网络模型概述 接下来几天,将把自己最近读的关于图片分类的经典网络模型论文整理一遍。大概做个摘要。这些论文都是在imagenet上1.2 million数据训练出来的。 由于从这些预训练的网络训练的deep feature有良好的泛化能力,可以应用到 ...

Fri Mar 01 23:43:00 CST 2019 0 1468
FPGA——UDP包分片概述

一、概述 以太网(Ethernet)数据帧的长度必须在46-1500字节之间,这是由以太网的物理特性决定的. 这个1500字节被称为链路层的MTU(最大传输单元). 在实际使用中,单次UDP报文传输的数据量有可能会大于1500字节,因此需要用到UDP分片技术 二、UDP分片 (1)UDP封装 ...

Thu Mar 31 07:20:00 CST 2022 1 1073
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM