花费 6 ms
解密万亿参数M6模型预训练背后的分布式框架Whale

​简介: 最近,阿里云PAI团队和达摩院智能计算实验室一起发布“低碳版”巨模型M6,大幅降低万亿参数超大模型训练能耗。借助我们自研的Whale框架仅使用480卡GPU,即训练出了规模达人类神经元10倍 ...

Wed Aug 18 23:37:00 CST 2021 0 93

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM