網上沒找到簡易的教程,記錄一下。挺好用的。
(1)點擊connect
(2)輸入必要信息
(3)選擇測試內容
具體的含義和nvprof的metrics一樣,other選項卡里面可以配置特定的metrics,見 https://s0docs0nvidia0com.icopy.site/cuda/profiler-users-guide/index.html#metrics-reference
(4)點擊connect測試
有內存使用情況、資源情況的圖表等,還有添加baseline對比、評價等功能
注意事項:需要使用ROOT連接remote,remote需要root可以ssh
參考文檔:
https://devblogs.nvidia.com/using-nsight-compute-to-inspect-your-kernels/