本文轉載自查看原文 2018-01-19 16:44 3711 機器學習/ AI芯片

寒武紀芯片

產品中心> 智能處理器IP

智能處理器IP

MLU智能芯片

1A的升級版本，能效比得到數倍提升，擁有更廣泛的通用性，可廣泛應用於計算機視覺、語音識別、自然語言處理等智能處理關鍵領域。

: TensorFlow Caffe MXNet; 難點：; 作者：祖亞洲
鏈接：https://www.zhihu.com/question/41469046/answer/124179575

這個工作繼續下去有潛力把一整套系統做出來， chip tape-out, compiler/language support, multi-chip interconnect, 等等，但是繼續下去有很多 design consideration 需要討論:

1. Accelerator 和 CPU 的通信怎么做，像 nvidia 對他的GPU有一整套通信機制，只是沒有開源。這些CPU和accelerator的通信模型是很煩的，需要的支持團隊也不小。他怎么從 CPU instruct accelerator 去load數據，怎么保持數據一致性，這些design很費腦子，退一步說，這一整套 API 的實現可不簡單。

2. 這個編譯器，還有programming model怎么做，是准備在C/C++里面加特定的pragma/library，還是讓python自動compile某一部分代碼到這個ISA，然后下面的runtime自己manage CPU-accelerator 通信。

3. 現在工業界搞的NN都巨大無比，你單個加速器就算是power8那么大的，全是SIMD lanes也不夠。這個加速器怎么支持distributed計算，怎么和tensorflow/CNTK的framework融合。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 AI處理器-寒武紀NPU芯片簡介寒武紀思元290芯片和MLU290-M5卡 FPGA/IC筆試——寒武紀寒武紀智能系統參數什么是寒武紀、志留紀、泥盆紀、白堊紀寒武紀人工智能開發平台寒武紀端雲一體人工智能開發平台整體架構寒武紀C++日常實習生面經（其他人面試題）寒武紀加速平台(MLU200系列) 摸魚指南（二）--- 模型移植-環境搭建寒武紀加速平台(MLU200系列) 摸魚指南（一）--- 基本概念及相關介紹