原文:[源码解析] PyTorch 流水线并行实现 (2)--如何划分模型

源码解析 PyTorch 流水线并行实现 如何划分模型 目录 源码解析 PyTorch 流水线并行实现 如何划分模型 x 摘要 x 问题 x 自动平衡 . Automatic Balancing . 基础函数 函数 . . Batch . . layerwise sandbox . . detach . 据计算时间来平衡 . 据内存大小来平衡 . 分割算法 x 模型划分 . 调用 . GPipe ...

2021-09-24 16:24 0 252 推荐指数:

查看详情

数据并行模型并行流水线并行

一、数据并行(DP ) 1、概念:相同的模型分布在不同的GPU上,在不同的GPU上使用不同的数据。每一张GPU上有相同的参数,在训练的时候每一个GPU训练不同的数据,相当于增大了训练时候的batch_size。   数据并行基于一个假设:所有节点都可以放下整个模型。这个假设在某些模型 ...

Sun Mar 27 04:40:00 CST 2022 0 3509
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM