AI訓練與推理芯片


AI訓練與推理芯片

  1. 訓練芯片

1.1.雲燧T20

基於邃思2.0芯片打造的面向數據中心的第二代人工智能訓練加速卡,具有模型覆蓋面廣、性能強、軟件生態開放等特點,可支持多種人工智能訓練場景。同時具備靈活的可擴展性,提供業界領先的人工智能算力集群方案。

 

 

 高密的計算芯片

57.5mm × 57.5mm超大封裝尺寸提供高密的澎湃人工智能算力。

強勁的單精算力

最高達40TFLOPS(FP32)、160TFLOPS(TF32)的單精度算力。

先進的堆疊存儲

基於HBM2E存儲方案,最高可支持64GB容量,1.8TB/s帶寬。

靈活的算力擴展

300GB/s的獨立片間互聯通道提供靈活的多芯片算力擴展方案。

邃思2.0芯片基於人工智能領域專用處理器架構設計,提供強勁的全精度人工智能算力、先進的存儲方案、靈活的可擴展性,廣泛支持視覺、語音語義、強化學習等各技術方向的模型訓練。

 

 

 GCU-CARA 2.0架構

具有完全自主知識產權的通用計算架構,集成領先的計算引擎、數據引擎和互聯引擎,提供高密的全精度人工智能算力,廣泛支持各類型深度學習模型訓練。

先進存儲

搭載業界領先的HBM2E存儲方案,具備超大存儲容量和訪存帶寬,最高達到64GB和1.8TB/s,高效支持超大規模模型訓練。

高速互聯

燧原智能互聯(GCU-LARE)是專為人工智能訓練集群研發的互聯技術,提供300GB/s互聯帶寬,支持數千張雲燧加速卡互聯,具備優異的線性加速比。

性能表現

 

 

 參數

 

1.2.雲燧T21

基於OCP(開放計算項目)OAM(開放加速模組)標准設計、兼容OCP OAI標准(開放加速器基礎設施)的高性能人工智能訓練加速模組,基於邃思2.0芯片打造的,面向數據中心,可廣泛應用於互聯網、金融、教育、醫療、工業以及政務等行業。

 

 

 高密的計算芯片

57.5mm × 57.5mm超大封裝尺寸提供高密的澎湃人工智能算力。

強勁的單精算力

最高達40TFLOPS(FP32)、160TFLOPS(TF32)的單精度算力。

先進的堆疊存儲

基於HBM2E存儲方案,最高可支持64GB容量,1.8TB/s帶寬。

靈活的算力擴展

300GB/s的獨立片間互聯通道提供靈活的多芯片算力擴展方案。

邃思2.0芯片基於人工智能領域專用處理器架構設計,提供強勁的全精度人工智能算力、先進的存儲方案、靈活的可擴展性,廣泛支持視覺、語音語義、強化學習等各技術方向的模型訓練。

 

 

 生態開放

基於OCP OAM標准(開放加速模組)

兼容OCP OAI標准(開放加速器基礎設施)

提供更高效的服務器和數據中心設計。

 

 

 高速互聯

燧原智能互聯(GCU-LARE)是專為人工智能訓練集群研發的互聯技術,提供300GB/s互聯帶寬,支持數千張雲燧加速卡互聯,具備優異的線性加速比。

GCU-CARA 2.0架構

具有完全自主知識產權的通用計算架構,集成領先的計算引擎、數據引擎和互聯引擎,提供高密的全精度人工智能算力,廣泛支持各類型深度學習模型訓練。

性能表現

 

 

 參數

 

 

 2. 推理芯片

雲燧i10是一款面向雲端數據中心的高性能人工智能推理加速卡,可廣泛應用於計算機視覺、自然語言處理、語音識別與合成、知識圖譜等多類型雲端推理場景。

 

 

 

 

 性能表現

 

 

 參數

 

 

 3. 軟件平台

 

 

 特性

 

 

 計算及編程平台

 

 

 產品應用

CLOUDBLAZER T20

雲燧T20是基於邃思2.0芯片打造的面向數據中心的第二代人工智能訓練加速卡,具有模型覆蓋面廣、性能強、軟件生態開放等特點,可支持多種人工智能訓練場景。同時具備靈活的可擴展性,提供業界領先的人工智能算力集群方案。

CLOUDBLAZER T21

雲燧T21是基於OCP(開放計算項目)OAM(開放加速模組)標准設計、兼容OCP OAI標准(開放加速器基礎設施)的高性能人工智能訓練加速模組,基於邃思2.0芯片打造的,面向數據中心,可廣泛應用於互聯網、金融、教育、醫療、工業以及政務等行業。

 

 

 

參考鏈接:https://www.enflame-tech.com/


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM