這個系列的精華部分在 基於FPGA的CNN算法移植(一)概述 后面我真不知道怎么寫了,再寫就有泄密的風險。或者可以去討論HLS 或者是SDsoc。 可是我真的想多做點筆記和大家一起討論一下,思前想后就寫這個吧。 這個是分析別人家公司的一個 ...
這次我們來談談硬件架構,其實沒啥好說的,就是科普的東西。因為這個玩意兒真的沒啥新意 第一款:google的TPU 架構 圖中DDR 僅僅是用來傳送數據量小的權重,因為DDR 的速度實在是跟不上啊。而激活值采用 GiB S 的速度傳入和傳出,中間那個矩陣乘法器是 個 ,運算力相當野蠻吧。中間就是一些控制邏輯 不同層控制不同,還有就是一些為了保障速度的輔助邏輯。 第二款: 深鑒科技的DPU 由上面的 ...
2018-03-15 11:51 0 2048 推薦指數:
這個系列的精華部分在 基於FPGA的CNN算法移植(一)概述 后面我真不知道怎么寫了,再寫就有泄密的風險。或者可以去討論HLS 或者是SDsoc。 可是我真的想多做點筆記和大家一起討論一下,思前想后就寫這個吧。 這個是分析別人家公司的一個 ...
做了半年的CNN算法移植,有時候需要回避一些東西,所以寫的東西不能太多。簡單提一下自己的總結,既是筆記,又是與網友們交流討論。 CNN興起,深圳這個躁動的城市很多人就想趁着這個機會撈一筆風投。於是各種基於CNN的在GPU上的demo出現后立馬就成立公司,招FPGA ...
以下內容為QQ聊天整理,以及網絡資料整理。本人不懂算法,如有紕漏,還請指正。 以下才是真正意義上的優化,有時候我們在面試的時候遇到招 FPGA算法優化工程師,糊弄起來,是,我們用FPGA對算法實現了優化加速,其實不是真正意義上的算法優化 ...
這是一篇對地平線公司產品的猜想博文,本人對地平線充滿了無限的仰望和崇拜,絕無冒犯之意。因為對AI芯片設計公司感興趣所以才分析。為何不分析別家呢? 因為4月在深圳會展中心的電子信 ...
一、CORDIC算法 CORDIC(Coordinate Rotation DIgital Computer)是一種通過迭代實現快速平面旋轉的算法,通過變形擴展,它可以對多種超越函數求值,例如三角/反三角函數、雙曲函數等。 對超越函數求值,常見方法為用多項式近似,例如利用泰勒展開來逼近 ...
網上對於FPGACNN加速的研究已經很多了,神經網絡的硬件加速似乎已經滿大街都是了,這里我們暫且不討論誰做的好誰做的不好,我們只是根據許許多多的經驗來總結一下實現硬件加速,需要哪些知識,考慮哪些因素。 很多人都說在做FPGA的神經網絡加速,可是有多少人真正拿出了實際結果,可能大部分人 ...
FPGA市場占有率最高的兩大公司Xilinx和Altera。 查找表(Look-Up-Table)簡稱為LUT,LUT本質上就是一個RAM。目前FPGA中多使用4輸入的LUT,所以每一個LUT可以看成一個有4位地址線的 的RAM。 當用戶通過原理圖或HDL語言描述了一個邏輯電路以后,PLD ...
本文設計方式采用明德揚至簡設計法。利用FPGA來完成顯示功能不是個很理想的方式,當顯示任務比較復雜,要通過各種算法顯示波形或者特定圖形時,當然要用單片機通過C語言完成這類流程控制復雜,又對時序要求不高的任務(這也堅定了我學習SOPC的決心)。但要驅動如LCD1602/LCD12864打印 ...