[筆記] 將numpy的操作轉移到pytorch的tensor上運行可以加速

本文轉載自查看原文 2020-03-18 22:15 1064 Linux/ Windows/ Python

簡單起見，僅實驗了矩陣加法及廣播操作，其他操作未實驗。

目前結論是：

將numpy轉為pytorch的tensor，可以加速(0.22s -> 0.12s)
如果將tensor加載到gpu上，能夠加速更多(0.22s -> 0.0005s)，但是內存與顯存的拷貝時間不容忽視

實驗過的環境如下，結論都成立：

Win10, 64 bit
Ubuntu 18.04, 64 bit

但是據同事在Win10的Linux子系統下驗證，據說將numpy轉為pytorch的tensor后反而比前者更慢，懷疑是子系統實現產生的問題。

下面是驗證流程。

import time
import numpy as np
import torch

print(torch.__version__)

1.4.0

def check_time(func, run_times=10):
    t = time.time()
    for i in range(run_times):
        func()
    print('avg time = %s sec' % ((time.time()-t)/run_times))

shape = (5000,5000)
a = np.ones(shape, dtype=np.float)
b = np.ones(shape, dtype=np.float)
k = np.ones((shape[0],1), dtype=np.float)

# - simple numpy ndarray plus

def test_np_1():
    c = a+b
    return c

check_time(test_np_1)

avg time = 0.21692438125610353 sec

# - simple numpy ndarray and broadcast

def test_np_2():
    c = a+b+k
    return c

check_time(test_np_2)

avg time = 0.45278918743133545 sec

# - use pytorch tensor

def test_torch_1():
    ta = torch.from_numpy(a)
    tb = torch.from_numpy(b)
    tc = ta+tb
    c = tc.numpy()
    return c

check_time(test_torch_1)

avg time = 0.11778402328491211 sec

# - use pytorch tensor and broadcast

def test_torch_2():
    ta = torch.from_numpy(a)
    tb = torch.from_numpy(b)
    tk = torch.from_numpy(k)
    tc = ta+tb+tk
    c = tc.numpy()
    return c

check_time(test_torch_2)

avg time = 0.2651021957397461 sec

# - check gpu

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print(device)

ga = torch.from_numpy(a).float().to(device)
gb = torch.from_numpy(b).float().to(device)
gk = torch.from_numpy(k).float().to(device)

cuda:0

# - try tensor on gpu

def test_torch_cuda_1():
    ca = torch.from_numpy(a).float().to(device)
    cb = torch.from_numpy(b).float().to(device)
    cc = ca+cb
    c = cc.cpu().numpy()
    return c

check_time(test_torch_cuda_1)

avg time = 0.44039239883422854 sec

# - try tensor on gpu and broadcast

def test_torch_cuda_2():
    ca = torch.from_numpy(a).float().to(device)
    cb = torch.from_numpy(b).float().to(device)
    ck = torch.from_numpy(k).float().to(device)
    cc = ca+cb+ck
    c = cc.cpu().numpy()
    return c

check_time(test_torch_cuda_2)

avg time = 0.4477779150009155 sec

# - try tensor on gpu and broadcast, preload in gpu before call, and not copy to cpu after

def test_torch_cuda_3():
    cc = ga+gb+gk
    return cc

check_time(test_torch_cuda_3)

avg time = 0.0004986286163330078 sec

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pytorch tensor與numpy轉換 ----git從一個commit轉移到另一個分支---- vue組件內的元素轉移到指定位置從Eclipse轉移到IntelliJ IDEA的一點心得我能否把一個開發者帳號下的app轉移到另一個開發者帳號下面？使用six庫將Python2的項目完全轉移到python3 PHP網站從Apache轉移到Nginx后產生404錯誤的原因和解決辦法 TFS2010恢復（轉移到新服務器）簡單步驟 Python安裝依賴包及開發工具轉移到Visual Studio 2019 TFS2010遷移（轉移到新服務器）簡單步驟