AI訓練與推理芯片

本文轉載自查看原文 2021-08-05 06:12 209

AI訓練與推理芯片

訓練芯片

1.1.雲燧T20

基於邃思2.0芯片打造的面向數據中心的第二代人工智能訓練加速卡，具有模型覆蓋面廣、性能強、軟件生態開放等特點，可支持多種人工智能訓練場景。同時具備靈活的可擴展性，提供業界領先的人工智能算力集群方案。

高密的計算芯片

57.5mm × 57.5mm超大封裝尺寸提供高密的澎湃人工智能算力。

強勁的單精算力

最高達40TFLOPS（FP32）、160TFLOPS（TF32）的單精度算力。

先進的堆疊存儲

基於HBM2E存儲方案，最高可支持64GB容量，1.8TB/s帶寬。

靈活的算力擴展

300GB/s的獨立片間互聯通道提供靈活的多芯片算力擴展方案。

邃思2.0芯片基於人工智能領域專用處理器架構設計，提供強勁的全精度人工智能算力、先進的存儲方案、靈活的可擴展性，廣泛支持視覺、語音語義、強化學習等各技術方向的模型訓練。

GCU-CARA 2.0架構

具有完全自主知識產權的通用計算架構，集成領先的計算引擎、數據引擎和互聯引擎，提供高密的全精度人工智能算力，廣泛支持各類型深度學習模型訓練。

先進存儲

搭載業界領先的HBM2E存儲方案，具備超大存儲容量和訪存帶寬，最高達到64GB和1.8TB/s，高效支持超大規模模型訓練。

高速互聯

燧原智能互聯（GCU-LARE）是專為人工智能訓練集群研發的互聯技術，提供300GB/s互聯帶寬，支持數千張雲燧加速卡互聯，具備優異的線性加速比。

性能表現

參數

1.2.雲燧T21

基於OCP（開放計算項目）OAM（開放加速模組）標准設計、兼容OCP OAI標准（開放加速器基礎設施）的高性能人工智能訓練加速模組，基於邃思2.0芯片打造的，面向數據中心，可廣泛應用於互聯網、金融、教育、醫療、工業以及政務等行業。

高密的計算芯片

57.5mm × 57.5mm超大封裝尺寸提供高密的澎湃人工智能算力。

強勁的單精算力

最高達40TFLOPS（FP32）、160TFLOPS（TF32）的單精度算力。

先進的堆疊存儲

基於HBM2E存儲方案，最高可支持64GB容量，1.8TB/s帶寬。

靈活的算力擴展

300GB/s的獨立片間互聯通道提供靈活的多芯片算力擴展方案。

生態開放

基於OCP OAM標准（開放加速模組）

兼容OCP OAI標准（開放加速器基礎設施）

提供更高效的服務器和數據中心設計。

高速互聯

燧原智能互聯（GCU-LARE）是專為人工智能訓練集群研發的互聯技術，提供300GB/s互聯帶寬，支持數千張雲燧加速卡互聯，具備優異的線性加速比。

GCU-CARA 2.0架構

性能表現

參數

2. 推理芯片

雲燧i10是一款面向雲端數據中心的高性能人工智能推理加速卡，可廣泛應用於計算機視覺、自然語言處理、語音識別與合成、知識圖譜等多類型雲端推理場景。

性能表現

參數

3. 軟件平台

特性

計算及編程平台

產品應用

CLOUDBLAZER T20

雲燧T20是基於邃思2.0芯片打造的面向數據中心的第二代人工智能訓練加速卡，具有模型覆蓋面廣、性能強、軟件生態開放等特點，可支持多種人工智能訓練場景。同時具備靈活的可擴展性，提供業界領先的人工智能算力集群方案。

CLOUDBLAZER T21

雲燧T21是基於OCP（開放計算項目）OAM（開放加速模組）標准設計、兼容OCP OAI標准（開放加速器基礎設施）的高性能人工智能訓練加速模組，基於邃思2.0芯片打造的，面向數據中心，可廣泛應用於互聯網、金融、教育、醫療、工業以及政務等行業。

參考鏈接：https://www.enflame-tech.com/

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 傳統芯片與AI芯片 AI芯片設計流程 AI 芯片的分類及技術國內AI與芯片企業列表低數值精度推理和訓練使用Tensorflow Object Detection進行訓練和推理 AI芯片技術與市場競爭【AI小疑問】如何加載PB文件並推理預測滴滴推理引擎IFX：千萬規模設備下AI部署實踐存算一體AI芯片