自从白嫖google的colab之后,真香!记录一下使用pip下载kaggle数据集的步骤和使用时遇到的一下问题。
1. 安装
pip install kaggle
pip install --upgrade kaggle
2. 配置
首先到My Account中生成 kaggle API,如下图,点击创建新token就会默认下载一个kaggle.json文件
接着设置API,设置API有两种方式,kaggle api的 github 项目上面说明了。
方式一:将kaggle.json下载后放到 ~/.kaggle/kaggle.json,并使用chmod 600修改访问权限
方式二:设置临时环境变量 KAGGLE_USERNAME 和 KAGGLE_KEY 。
3. 案例
选择第二种方式时,在colab上使用export好像没用,于是使用了set_env
命令。
%set_env KAGGLE_USERNAME=name
%set_env KAGGLE_KEY=xxxxxxxxxxxxxxxxxxxx
随便找了个数据集 NFL Big Data Bowl 2021
,以其为例。
注:下载某个数据集时事先需要到rules中选择 accept rules,否则会出现 403 Not Found 错误。
接着到 Data 的导航标签中,copy命令
在colab中执行命令
!kaggle competitions download -c nfl-big-data-bowl-2021