AI訓練與推理芯片
- 訓練芯片
1.1.雲燧T20
基於邃思2.0芯片打造的面向數據中心的第二代人工智能訓練加速卡,具有模型覆蓋面廣、性能強、軟件生態開放等特點,可支持多種人工智能訓練場景。同時具備靈活的可擴展性,提供業界領先的人工智能算力集群方案。
高密的計算芯片
57.5mm × 57.5mm超大封裝尺寸提供高密的澎湃人工智能算力。
強勁的單精算力
最高達40TFLOPS(FP32)、160TFLOPS(TF32)的單精度算力。
先進的堆疊存儲
基於HBM2E存儲方案,最高可支持64GB容量,1.8TB/s帶寬。
靈活的算力擴展
300GB/s的獨立片間互聯通道提供靈活的多芯片算力擴展方案。
邃思2.0芯片基於人工智能領域專用處理器架構設計,提供強勁的全精度人工智能算力、先進的存儲方案、靈活的可擴展性,廣泛支持視覺、語音語義、強化學習等各技術方向的模型訓練。
GCU-CARA 2.0架構
具有完全自主知識產權的通用計算架構,集成領先的計算引擎、數據引擎和互聯引擎,提供高密的全精度人工智能算力,廣泛支持各類型深度學習模型訓練。
先進存儲
搭載業界領先的HBM2E存儲方案,具備超大存儲容量和訪存帶寬,最高達到64GB和1.8TB/s,高效支持超大規模模型訓練。
高速互聯
燧原智能互聯(GCU-LARE)是專為人工智能訓練集群研發的互聯技術,提供300GB/s互聯帶寬,支持數千張雲燧加速卡互聯,具備優異的線性加速比。
性能表現
參數
1.2.雲燧T21
基於OCP(開放計算項目)OAM(開放加速模組)標准設計、兼容OCP OAI標准(開放加速器基礎設施)的高性能人工智能訓練加速模組,基於邃思2.0芯片打造的,面向數據中心,可廣泛應用於互聯網、金融、教育、醫療、工業以及政務等行業。
高密的計算芯片
57.5mm × 57.5mm超大封裝尺寸提供高密的澎湃人工智能算力。
強勁的單精算力
最高達40TFLOPS(FP32)、160TFLOPS(TF32)的單精度算力。
先進的堆疊存儲
基於HBM2E存儲方案,最高可支持64GB容量,1.8TB/s帶寬。
靈活的算力擴展
300GB/s的獨立片間互聯通道提供靈活的多芯片算力擴展方案。
邃思2.0芯片基於人工智能領域專用處理器架構設計,提供強勁的全精度人工智能算力、先進的存儲方案、靈活的可擴展性,廣泛支持視覺、語音語義、強化學習等各技術方向的模型訓練。
生態開放
基於OCP OAM標准(開放加速模組)
兼容OCP OAI標准(開放加速器基礎設施)
提供更高效的服務器和數據中心設計。
高速互聯
燧原智能互聯(GCU-LARE)是專為人工智能訓練集群研發的互聯技術,提供300GB/s互聯帶寬,支持數千張雲燧加速卡互聯,具備優異的線性加速比。
GCU-CARA 2.0架構
具有完全自主知識產權的通用計算架構,集成領先的計算引擎、數據引擎和互聯引擎,提供高密的全精度人工智能算力,廣泛支持各類型深度學習模型訓練。
性能表現
參數
2. 推理芯片
雲燧i10是一款面向雲端數據中心的高性能人工智能推理加速卡,可廣泛應用於計算機視覺、自然語言處理、語音識別與合成、知識圖譜等多類型雲端推理場景。
性能表現
參數
3. 軟件平台
特性
計算及編程平台
產品應用
CLOUDBLAZER T20
雲燧T20是基於邃思2.0芯片打造的面向數據中心的第二代人工智能訓練加速卡,具有模型覆蓋面廣、性能強、軟件生態開放等特點,可支持多種人工智能訓練場景。同時具備靈活的可擴展性,提供業界領先的人工智能算力集群方案。
CLOUDBLAZER T21
雲燧T21是基於OCP(開放計算項目)OAM(開放加速模組)標准設計、兼容OCP OAI標准(開放加速器基礎設施)的高性能人工智能訓練加速模組,基於邃思2.0芯片打造的,面向數據中心,可廣泛應用於互聯網、金融、教育、醫療、工業以及政務等行業。
參考鏈接:https://www.enflame-tech.com/