自從白嫖google的colab之后,真香!記錄一下使用pip下載kaggle數據集的步驟和使用時遇到的一下問題。
1. 安裝
pip install kaggle
pip install --upgrade kaggle
2. 配置
首先到My Account中生成 kaggle API,如下圖,點擊創建新token就會默認下載一個kaggle.json文件
接着設置API,設置API有兩種方式,kaggle api的 github 項目上面說明了。
方式一:將kaggle.json下載后放到 ~/.kaggle/kaggle.json,並使用chmod 600修改訪問權限
方式二:設置臨時環境變量 KAGGLE_USERNAME 和 KAGGLE_KEY 。
3. 案例
選擇第二種方式時,在colab上使用export好像沒用,於是使用了set_env
命令。
%set_env KAGGLE_USERNAME=name
%set_env KAGGLE_KEY=xxxxxxxxxxxxxxxxxxxx
隨便找了個數據集 NFL Big Data Bowl 2021
,以其為例。
注:下載某個數據集時事先需要到rules中選擇 accept rules,否則會出現 403 Not Found 錯誤。
接着到 Data 的導航標簽中,copy命令
在colab中執行命令
!kaggle competitions download -c nfl-big-data-bowl-2021