libtorch默認是將cpu性能全部耗光,cpu利用率達到95%,需要設置並行計算的線程數,設置函數是torch::set_num_threads(1);
python版本的torch.set_num_threads(1)
resnet50模型
cpu型號:I7 4770 3.6HZ 內存16G
pytorch 單線程cpu速度大概285ms 增加線程速度反而降低 兩個線程300ms 4個線程350ms
gpu 750ti 85ms
libtorch 單線程cpu速度大概230ms 增加一個線程速度大概175ms 4個線程130ms
參考文章:https://blog.csdn.net/jacke121/article/details/104347069