标题:玩转百度AI Studio 之 用“四十路泰坦”跑线性回归

百度AI Studio是针对AI学习者的在线一体化开发实训平台,集合了AI教程。比如深度学习样例工程、各领域的经典数据集、云端的运算及存储资源, 以及比赛平台和社区等。
AI Studio干货满满,刚接触的同学未免不知从何处开始了解,今天将就以“在AI Studio上建立线性回归项目”为示例,来学习一下AI Studio的特点和基本操作方式。
本文只讲AI Studio的特性和操作方式,想具体了解线性回归实现方式的同学可查看网站的示例项目:http://aistudio.baidu.com/ais...
正式开始讲:
1.Ai Studio 的“单机项目”和 Notebook
登录Ai Studio的网站后,最先看到的是一个“创建项目”的按钮,这就是所有项目的起点。大胆的点下去,这时页面出现一个神奇的弹窗,这里罗列了很多创建项目的选项,这次可以先不管“项目环境”和“预加载项目框架”,选择默认,在“配置资源”中,选择“单机”(为什么不选“远程集群”后面会讲),项目名称和项目描述可按需编辑。
此时,左下角的两个小“按钮”,需要点击“添加数据集”(数据集是训练模型的素材,这里已经提前备好一个数据集),用户只需选择“UCI Housing数据集”。

如上图所示,点击“添加”,即可回到刚才界面,再点击“创建”,弹窗提示项目创建成功,至此,用户已完成一个单机项目的创建。下一步,可点击“查看”,了解该项目详情。
进入项目,左边是项目的基本信息,右边是代码区域(处于原是为编辑状态),若用户点击代码区域,不能实现编辑,用户需要点击右上角“运行项目”,进而进入编辑代码页面。

经加载后,系统将自动提示项目启动成功,点击“进入”,即可跳转到一个新的界面——Notebook界面。简单来说,Notebook的特点就是可以分段运行代码、灵活调试等。

下一个步骤,则正式进入写代码阶段!

但是,今天的内容并不是如何写代码,而是需要在AI Studio上找一个现成的示例项目:http://aistudio.baidu.com/ais...,复制代码。
为了体现Notebook的特点,此部分代码已被分成不同段落,用户点击任意一段代码块,可以看到代码块顶部出现了一行按钮,由上至下可依次点击每个代码块的“运行”按钮。

只要用户按正确的顺序运行了代码块,将会获得一些数据的输出。至此,用户已完成一个单机项目(此过程略去代码编写和调试过程,用户熟悉操作后,可以自行尝试编写程序并运行,逐渐“进化”为代码高手。)
在变成高手的过程中,用户可能会发现单机项目的一个缺点:算力不足。当项目计算量不断提升,单机项目的训练效率开始降低,训练一个模型需要几个小时甚至几天,此时需要用到“集群项目”。

如何建立一个算力超强的“集群项目”?
AI Studio为开发者准备了强大的GPU集群,提供充沛的算力。比如,网上常说的土豪GPU配置,是用户最熟悉的“四路泰坦”,拥有这种配置的主机可以通吃各路3A级游戏大作。

AI Studio的GPU集群理论上能输出的算力,超过10个“四路泰坦”,而这些算力资源,是完全免费提供给开发者使用。所以在AI Studio上,理论上可以免费使用“四十路泰坦”跑线性回归模型(现实中AI Studio会为开发者们动态分配算力资源,要出现这种情况还是挺难的)。

如何使用“四十路泰坦”撸线性回归?。
回到首页,点击“创建项目”,在“资源配置”中改成选择“程集群”,其他步骤和单机项目相同,完成创建,运行项目。这时,用户会发现代码编辑的界面略有不同,“集群项目”只有一个代码框,这与用户熟悉的代码编辑方式是一致的,同时也意味着在这里无法进行灵活的调试。
在此步骤,可以将单机项目的线性回归代码进行复制,点击页面右下角的“提交”,用户的代码就被保存并执行了,同时跳转到“历史任务页面”。
用户可在此页面可以看到所有任务的执行情况,并做如下操作:
下载输出: 下载任务输出文件, 文件格式xxx(任务编号)_output.tar.gz
下载日志: 下载任务执行日志, 日志格式xxx(任务编号)_log.tar.gz
终止任务: 在任务执行过程中, 可以点击终止任务
查看详情: 查看任务在执行时的代码版本内容
截至目前,用户已完成一个集群项目。

用单机项目调试,用集群项目训练
经过以上两个实践可以得出一个经验,在处理算力需求较大的项目时,使用集群项目可以获得更多算力资源,在集群项目提交之前,可以建一个单机项目来调试代码,提高训练效果。
以上就是今天要给大家介绍的知识点,希望大家能在AI Studio中有所收获!


深度学习之桨
3 声望2 粉丝