地址:https://www.kaggle.com/
創建 notebook
- 進入主頁,在左側選擇
code
- 選擇新建
- 剩下的操作步驟就跟 jupyter notebook一樣了
導入kaggle數據集
- 進入notebook,選擇右側的
Add Data
- 輸入想要的數據集,這里以
d2l-Classify-Leaves
李沐老師的競賽為例。先右上角search,再add即可
- 導入效果如下
讀取導入的數據集
- 以讀取
test.csv
為例,先點擊 開關 的按鈕,連接內核
- 連接內核后可點擊,查看資源的使用情況
- 在cell里編寫代碼, 這里csv的路徑可以通過:右側的Data框選擇數據集,然后點擊復制即可
import pandas as pd
df = pd.read_csv("../input/d2lclassifyleaves/test.csv")
df
output:
使用GPU加速訓練
- 點擊右上角的更多->加速器->GPU or TPU
- 會提示,每周最多使用38小時
- 效果如下
- 查看分配的GPU情況,在cell里輸入
! nvidia-smi
可以看到分配的是P100
離線跑模型
有時候跑模型需要半天甚至更久,那么就需要在后台跑模型了
- 先在notebook編寫好代碼,然后選擇右上角的
Save
- 勾選保存
- 在
Advanced
中選擇 gpu加速
- 選擇
Save
,在右下角會出現活動
- 注意:在后台運行過程中,是看不到執行步驟和輸出的,只有整個代碼跑完才行,成功后顯示如下
- 點擊該活動可以看到