12月初,全球云服务市场份额最大的亚马逊AWS发布了完全免费的机器学习实验/实践平台 - AWS SageMaker Studio Lab。又是一款很适合实验室资源排队排不到或者出门在外手头没有GPU算力的同学。博主闻之马上申请(piao)了一份来试试看体验对比Google Colab怎么样。

SageMaker Studio Lab官网

官网简洁大方

目前采用申请注册制,注册信息只需要填写一些基本信息(邮箱啥的),以及自己所属组织/职业,还有准备用来干什么就可以了。申请通过后它会往你的邮箱发一个注册链接,然后就能注册账号使用了。我是周五填写的申请,周二下来的Approval,真羡慕这种顶级大厂965不加班的作风啊

申请账号通过


使用篇

主页面也十分的简洁直观,只需要点一个按钮就可以启动自己的工作区

AWS目前给到的配额是一次CPU实例可以使用12小时,GPU实例可以使用4小时

时间到了之后它会自动销毁容器(会帮你保存工作区数据),之后可以再次启动(数据会自动恢复,环境也不用重新配),又可以使用4个小时

也就是说目前配额是没有限制的,唯一的限制就是只能连续使用的时间限制,超时了就会断开一次

进入工作区之后,页面还是大家熟悉的Jupyter Notebook风格,并且比Colab额外提供了Linux终端,使用起来更方便


测试篇

接下来看一下给到的配置,看看性能到底怎么样

可以看到服务器位于俄亥俄州,因此物理延迟肯定200MS以上了。没有在西海岸地区部署对国内用户来说是一个遗憾

CPU方面每个实例给到了4核8线程,外加16G内存,还是很不错的

GPU方面给到的是Tesla T4,相比起来Colab免费用户大多数只能分配到的K80实在是要强太多了

我们跑一个深度强化学习DDPG模型,看下速度具体怎么样

厂商配置每个Episode耗时
AWS4C8T(3.2Ghz)+Tesla T4约1.05s
AWS4C8T(3.2Ghz) (单CPU跑)约1.92s
Google Colab2C2T(2.5Ghz) (单CPU跑)约3.42s
Google Colab2C2T(2.3Ghz)+Tesla K80约1.71s
其他16C16T(3.1Ghz)+Tesla V100约1.18s

使用感受

AWS不愧是云服务市场份额第一的顶级大厂,除了性能相当不错之外,最大的感受就是数据管理相当方便。用户数据和实例完全解耦了,不管是切换实例还是什么,你的数据永远都跟着你走;而Colab每次切换运行环境都需要重新导入数据,或者重新配一下环境

对比其他提供免费算力的大厂,阿里天池永远排队不到GPU(用起来感觉也很奇怪, 像是加班赶点整出来的半成品);百度AI Studio只能用PaddlePaddle框架(并且后台有检测, 不让你偷偷装Pytorch或者TensorFlow, 检测到了直接强制关闭实例);Google Colab用户太多、还需要科学上网才能用。

就一个字!

Last modification:December 28th, 2021 at 02:58 pm