1. 把內存變成硬盤,把需要讀的數據塞到里面去,加快了io。
Optimizing PyTorch training code
如何給你PyTorch里的Dataloader打雞血
輕輕松松為你的Linux系統創建RAM Disk
Linux創建使用內存硬盤(RAM DISK)
2. 使用英偉達的
博客: Introducing GPU Instances: Using Deep Learning to Obtain Frontal Rendering of Facial Images
DALI 文檔 : dali-pytorch
hdf5: Saving and loading a large number of images (data) into a single HDF5 file (圖片轉換成HDF5文件(加載,保存))
pt : https://discuss.pytorch.org/t/how-to-speed-up-the-data-loader/13740/3
5. 將原始數據保存為lmdb格式
博客:Efficiently processing large image datasets in Python
6. Python簡易實現並行操作
一行 Python 代碼實現並行