Pytorch中num_workers

本文轉載自查看原文 2020-11-13 15:47 522

Question

一直很迷，在給Dataloader設置worker數量（num_worker）時，到底設置多少合適？這個worker到底怎么工作的？如果將num_worker設為0（也是默認值），就沒有worker了嗎？

worker的使用場景：

from torch.utils.data import DataLoader

train_loader = DataLoader(dataset=train_data, batch_size=train_bs, shuffle=True, num_worker=4)
valid_loader = DataLoader(dataset=valid_data, batch_size=valid_bs, num_worker=4)

Answer

每每輪到dataloader加載數據時：

for epoch in range(start_epoch, end_epoch):
    for i, data in enumerate(trainloader):

dataloader一次性創建num_worker個worker，（也可以說dataloader一次性創建num_worker個工作進程，worker也是普通的工作進程），並用batch_sampler將指定batch分配給指定worker，worker將它負責的batch加載進RAM。然后，dataloader從RAM中找本輪迭代要用的batch，如果找到了，就使用。如果沒找到，就要num_worker個worker繼續加載batch到內存，直到dataloader在RAM中找到目標batch。一般情況下都是能找到的，因為batch_sampler指定batch時當然優先指定本輪要用的batch。
num_worker設置得大，好處是尋batch速度快，因為下一輪迭代的batch很可能在上一輪/上上一輪…迭代時已經加載好了。壞處是內存開銷大，也加重了CPU負擔（worker加載數據到RAM的進程是CPU復制的嘛）。num_workers的經驗設置值是自己電腦/服務器的CPU核心數，如果CPU很強、RAM也很充足，就可以設置得更大些。
如果num_worker設為0，意味着每一輪迭代時，dataloader不再有自主加載數據到RAM這一步驟（因為沒有worker了），而是在RAM中找batch，找不到時再加載相應的batch。缺點當然是速度更慢。

轉自 https://blog.csdn.net/weixin_43593330/article/details/107483671

同時可參考 https://zhuanlan.zhihu.com/p/69250939

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pytorch dataloader num_workers堵塞、卡死解決方法（對我來說本質原因是OSError: [WinError 1455] 頁面文件太小，無法完成操作） pytorch persistent_workers (十)pytorch多線程訓練，DataLoader的num_works參數設置 --num 與 num-- 的區別【PyTorch】PyTorch中的梯度累加 MySQL主從復制中的問題（Coordinator stopped beacause there were errors in the workers......） num&(num-1)的用途 html5 Web Workers pytorch 中的variable函數 Pytorch 中張量的理解