原文:BytePS

BytePS是一个高性能通用的分布式训练框架。支持TensorFlow,Keras,PyTorch和MXNet,可以跑在TCP和RDMA Remote Direct Memory Access,远程直接内存访问 网络上。BytePS的性能比现有的开源分布式训练框架都好很多,例如,在流行的公有云上,用相同数量的GPU,BytePS的训练速度是Horovod NCCL的两倍。 为了证明,我们测试两个模 ...

2019-07-02 14:33 0 944 推荐指数:

查看详情

Nccl allreduce && BytePS原理

一、Nccl AllReduce基本原理: allreduce是collective communication中的一种,其他种类的还有:Broadcast、Scatter、Gather、Reduc ...

Wed Aug 14 06:25:00 CST 2019 0 1167
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM