原文:[源码解析] 模型并行分布式训练Megatron (2) --- 整体架构

源码解析 模型并行分布式训练Megatron 整体架构 目录 源码解析 模型并行分布式训练Megatron 整体架构 x 摘要 x 启动 . 分布式启动 . 构造基础 . . 获取模型 . . 获取数据集 . . 步进函数 . . . 广播数据 x Pretrain x 初始化 . initialize megatron . 初始化分布式环境 . 初始化进程组全局变量 x 设置模型 . setu ...

2022-02-07 20:12 0 4979 推荐指数:

查看详情

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM