原文:BytePS

BytePS是一個高性能通用的分布式訓練框架。支持TensorFlow,Keras,PyTorch和MXNet,可以跑在TCP和RDMA Remote Direct Memory Access,遠程直接內存訪問 網絡上。BytePS的性能比現有的開源分布式訓練框架都好很多,例如,在流行的公有雲上,用相同數量的GPU,BytePS的訓練速度是Horovod NCCL的兩倍。 為了證明,我們測試兩個模 ...

2019-07-02 14:33 0 944 推薦指數:

查看詳情

Nccl allreduce && BytePS原理

一、Nccl AllReduce基本原理: allreduce是collective communication中的一種,其他種類的還有:Broadcast、Scatter、Gather、Reduc ...

Wed Aug 14 06:25:00 CST 2019 0 1167
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM