花费 30 ms
在超算系统上使用sbatch提交MXNet分布式训练任务

在超算系统上运行MXNet分布式训练任务时,面临着一个IP地址相关的问题。我们在提交MXNet的分布式任务时,需要知道各个GPU节点的IP地址,把这些IP地址放到一个hosts文件中,以供分布式训练使 ...

Mon Mar 15 02:16:00 CST 2021 0 383

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM