侵删
笔记:
- 梯子好像得全局模式才能分配到资源(但能google),PAC模式分配不了。
- 设置GPU 只需要在笔记本中的:修改->笔记本设置 当中就可以找到GPU选项。(不设置不是用GPU进行运算)
- 参考链接Pytorch是torch-1.0.0,tensor是这么用的
- 但我的Tensor是这样的(版本差异吧)
- 执行 !/opt/bin/nvidia-smi,看到分配给我的GPU是Tesla K80。
- 如果要安装其他的包,框架,或者某一版本的方法和我们在Linux环境下安装几乎没有差别 只需要注意在运行前加上“!”,换句话说你可以把Google Colab看成是一个Linux系统的页面。
- 如果需要购买Google drive内存的朋友,在网页上好像是不能用国内的银行卡支付的,最后解决的方法是在手机上下载了一个Google云端硬盘App,然后利用苹果APP Store绑定的银行卡就可以用国内的银行卡支付啦。
- Colab一些比较坑的地方:(1)挂载只有12个小时,也就是说12小时之后你就需要重现挂载一次,所以就需要我们在进行模型训练的时候记得要加上checkpoint,不然你如果训练的模型超过12小时,Google断开挂载你就白白浪费12小时啦。 (2)每次使用都需要重新配置你上次自己安装的环境,默认环境当然就不用啦。还有就是CUDA和Cudnn不需要重新配置(亲测),我也不知道为什么...欢迎指正。然后给大家安利一个方法,就是独立出一个页面把你要配的环境的代码都写在该页面下,下次打开只需要运行所有单元格就可以再开一个页面来跑你需要跑的程序啦。 (3)模型在训练的过程中 有可能会出现连接中断需要重新连接的情况,不要怕点击重新连接就行,如果经常出现推荐给大家一个脚本神器按键精灵,人不在电脑边上只需要F10启动脚本左键点击功能。【评论说:其实不用按键精灵,谷歌应用市场里就有一个拓展工具Auto reconnect colab,有网的时候都能给你重连上】 (4)如果电脑自动关机了,或者是自动更新什么的,只要时间不是很长,你只需要重启,恢复网页还是可以继续训练的,比较训练是挂载在Google上,但是时间久了也就要重新训练了。 (5)如果是断网了也只需要联网点击重新连接即可,同上如果断网太久也就只能重新训练了。
参考:使用Google-Colab训练PyTorch神经网络
笔记:
-
以 !开头的命令可以执行操作系统的指令
! pwd #打印当前目录 ! ls ! cd .. # 切换了外面的工作目录,但是不切换当前程序的工作目录
- 安装pytorch
-
安装方法一: ! pip3 install torch torchvision # 省事 安装方法二: ! uname -a # 查看系统 x86_64 GNU/Linux ! python --version # 查看python版本 Python 3.6.7 ! nvcc --version # 查看cuda版本 release 9.2, V9.2.148 在pytoch下载页面找到合适的版本,进行安装 ! pip install https://download.pytorch.org/whl/cu92/torch-0.4.1-cp36-cp36m-linux_x86_64.whl ! pip install torchvision