花费 15 ms
解密万亿参数M6模型预训练背后的分布式框架Whale

​简介: 最近,阿里云PAI团队和达摩院智能计算实验室一起发布“低碳版”巨模型M6,大幅降低万亿参数超大模型训练能耗。借助我们自研的Whale框架仅使用480卡GPU,即训练出了规模达人类神经元10倍的万亿参数多模态大模型M6,与传统海外公司实现万亿参数规模相比,能耗降低超八成、效率提升近11倍 ...

Wed Aug 18 23:37:00 CST 2021 0 93

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM