DataLoader worker (pid 2287) is killed by signal: Killed. pytorch训练解决方法


1.原因

可能是因为pytorch训练过程太费内存了,导致服务器内存不够,触发OS的保护机制,直接杀死了进程

2.解决方案

增加机器的swap区,以此来增加内存的交换区来“假装”增加内存条

2.1查询内存和交换区大小的命令

free

2.2先禁止swap功能

sudo swapoff /swapfile

执行完这个命令后,你用free会发现,swap区大小为零

2.3增加swapfile大小

sudo dd if=/dev/zero of=/swapfile bs=1M count=1024 oflag=append conv=notrunc

这个命令会在原swapfile基础上追加一个G的空间,如果空间不够,更改count的值即可。

2.4设置这个文件为swap分区的挂载点

sudo mkswap /swapfile

2.5启用swap

sudo swapon /swapfile

2.6使用free查看分区是否增加了

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM