视频
https://www.bilibili.com/video/BV1WQ4y1x76J/?aid=706550102&ci...
导读
随着生成式 AI 的出现,机器学习(ML)的广泛采用正处于转折点。与亚马逊云科技人工智能和机器学习服务副总裁 Bratin Saha 博士一道,聆听各个行业的客户如何利用人工智能和机器学习(包括生成式 AI)的最新突破,助他们转型业务。探索最新的亚马逊云科技创新,听取头部客户的意见,探索人工智能/机器学习的发展方向。
演讲精华
<font color = "grey">以下是小编为您整理的本次演讲的精华,共1600字,阅读时间大约是8分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。</font>
在场景开始时,Kimberly热情地欢迎她的同事Fry。接着,Fry提及了去年他曾提到过的一个大胆想法,即利用生成式AI通过将文本提示输入到Amazon的生成式AI服务Bedrock中,由该服务自动生成Kimberly的幻灯片。
Fry详细解释了他是如何利用具有166万亿参数的Bedrock的集成Titan模型来成功地创建Kimberly的演讲的。他愿意一步一步地向她展示整个过程。
Fry开始演示,描述了如何通过向Titan模型提供现有营销信息和幻灯片作为训练数据的背景形式来利用Bedrock的文本游乐场功能生成讨论要点。在输入背景信息作为提示后,Fry请求为演讲简介中的五个关键主题提供支持。
在短短几分钟内,Titan生成了五个清晰、相关且与Fry和Kimberly在准备和头脑风暴后的自己起草的主题非常接近的主题建议。Kimberly对AI产生的优质内容表示赞赏,并同意可以直接将其纳入她的演讲中。
Fry顺利地转入他的演讲,强调过去几年里,随着机器学习计算能力的增长,使用生成式AI制作幻灯片的想法已经不再荒谬。他们正在利用Bedrock的Titan模型(在Amazon Web Services上训练)通过数十亿倍的计算量来实现这一目标。
Fry指出,过去六年里,ML计算能力增长了10万倍,这要归功于用于训练复杂模型的云基础设施。模型训练的数据量增加了100倍,这要归功于Amazon S3的存储功能。模型大小从数百万增加到数十亿参数,这是由于像EC2 GPU实例这样的可扩展计算。
为了说明构建这些大型基础模型的挑战,Fry对比了人类可能在一生的时间内吸收10亿个单词,而用于训练基础模型的词数量达到了万亿级别。这代表了太字节的数据,比Wikipedia的6亿篇文章的内容还要多几千倍。将这些信息注入模型使其具有惊人的文本生成能力。
弗莱承认,客户的首要任务不仅仅是创建AI模型,而是与他们一起构建应用程序。他在开发自己的生成性AI应用程序(如Amazon Q)的过程中分享了经验教训,相信这些经验可以帮助客户建立和扩大自己的解决方案。
例如,本周推出的Amazon Q就是一个例子。它利用生成性AI让员工以自然语言提出问题、生成内容(如报告),并代表用户执行自动化工作流程来访问公司数据。
弗莱概述了在创建Q时所面临的一些关键考虑因素,这些问题反映了客户在开发企业AI应用程序时可能面临的挑战。首先需要解决的问题是从哪里开始以及选择哪个基础模型作为基础。每个模型都有其独特的优缺点,需要进行大量的实验来确定最佳选择。弗莱还通过展示不同模型的查询示例来说明这一点,演示了根据模型架构和训练数据,响应可能在简洁性、完整性和计算成本等方面有所不同。
弗莱预计客户将经历类似的过程,评估多个参数并在成本与性能之间找到平衡。大多数客户可能需要选择一个在某些关键方面表现出色的基础模型,然后从中优化。
这就是亚马逊Q的做法。最初,计划是利用一个大型模型来支持所有功能。但最终,一种使用多个更小、专门化的模型的异构体系结构在执行各种任务方面表现得更好。
在模型选择问题解决后,大量的工作投入到了数据工程和聚合中。为了生成准确的回应,Q会使用来自超过100个来源的数据,因此需要投入巨大的努力来构建与企业服务(如S3和Lambda)和其他服务的企业连接器,并对数据进行处理、清洁和质量检查。
在数据和模型到来之后,负责AI功能的发展也随之展开。弗莱伊提出了一个关于预期季度收入的假设性问题,这个问题涉及到机密数据。因此,Q必须遵守访问策略,只能向有权收到的20%授权用户提供答案。
在访问管理、内容过滤以及使用SageMaker Clarify实现整体负责任的人工智能集成方面,进行了大量工作,以确保Q能够遵循如HIPAA等法规。支撑这一切的是性能卓越且成本高效的ML基础设施,如用于训练和托管模型的EC2实例。
这使弗莱伊能够明确加速生成性AI采用的关键考虑因素。首先是模型的选择和灵活性,新的服务Amazon Bedrock提供了诸如CodeWhisperer之类的各种基础模型供用户使用和定制。
欧洲最大航空公司瑞安航空的首席技术官约翰·休利被邀请讨论他们如何使用Bedrock。他分享了他们如何利用SageMaker优化动态定价(使用实时数据),对400多架飞机的机队进行预测性维护,以及在93个基地的餐饮活动中生成食品包装计划。
新冠疫情为加速数字化转型提供了一个机会。休利给出了一些例子,如使用Lambda在3天内构建了一个数字疫苗护照移动钱包以满足意大利政府的指令,并在封锁期间使用他们托管的预订系统为超过2000万名乘客处理退款。
回到他们的食品包装项目,实际情况与理论产生了分歧。AI生成的包装计划在所有基地范围内大规模实施是不可行的。然而,与亚马逊云科技讨论他们如何解决类似问题时,瑞安航空开发了一款员工信息查询应用,仿照亚马逊的A到Z应用。
然后,他们使用Bedrock的CodeWhisperer模型创建了一个名为Zoe的AI助手,该助手可以在不需要查阅手册的情况下回答员工的问题。它提供了如何增加产品销售、飞行规定或公司仪容规定等信息。这个应用已经取得了成功,被数千名员工使用,他们计划不久后将此应用推广到整个公司的16500名员工。Zoe将帮助加速培训并提高参与度。
弗雷提出了第二个关键考虑因素:需要使用数据进行区分。富达投资的Vipin Narang强调,高质量的数据和策略是AI的关键驱动因素。他与亚马逊云科技进行了多年的合作,以建立管道,使用Amazon S3组织他们超过1PB的非结构化数据,并使用Kendra创建公司范围内的分类。
在良好的数据实践得到落实之后,Narang强调了生成性AI的四个关注领域:增强客户服务的对话式问答、提高开发者生产力的编码助手、基于Kendra的搜索以及他们正在探索的用于市场营销和销售赋能的内容生成。
他谈到了LLM创新的惊人速度,每天有超过1000个新模型添加到Hugging Face。他还讨论了防范幻觉的重要性以及评估严格性的重要性。最后,他重申了即使有了令人兴奋的新技术,高质量的数据仍然至关重要。
接下来,弗雷解决了负责任的人工智能问题。企业搜索助手Gleam的首席执行官Arwin Jan描述了他们在准确性、模型选择和数据分析安全方面的做法。检索增强生成确保只有客户数十百万文档库中的相关知识提供给像CodeWhisperer这样的模型。
后处理删除了低于70%置信度阈值的任何未经证实的回应。Bedrock的一组合规模型简化了选择和定制。在客户的自己的环境中运行确保了数据隐私和安全。
亚马逊云科技的端到端功能使他们能够提供有益且可信赖的搜索体验。在性能和优化成本的基础设施方面,技术创新研究所的Eta Sam Al Mazroui博士解释了亚马逊云科技如何促进在空前规模上训练模型。
TII的猎鹰自然语言模型已经利用SageMaker处理了数百万网页数据,并在4000个GPU实例上训练了180亿参数的模型,实现了166千万亿次性能,用于阿拉伯语建模。
Al Mazroui分享了关于愿景思考、实验和严格基准测试的最佳实践,这些实践塑造了他们在推进阿拉伯语语言模型方面的成就。与合作伙伴(如亚马逊云科技)的持续合作确保了TII能够在人工智能领域实现开创性的创新。
除了基础设施之外,让机器学习更加易于使用也至关重要。弗莱公司宣布,SageMaker Canvas已将其无代码界面扩展到了基础模型上,使得非技术用户也能够从生成性人工智能中受益。
最后,弗莱强调了即插即用式生成性人工智能应用的价值。例如,亚马逊云科技的HealthScribe应用利用CodeWhisperer分析医生与患者的对话并自动生成临床笔记,从而节省医生多达40%的时间,这些时间原本用于记录。
Netsmart的首席运营官Tom Herzog详细解释了HealthScribe的潜力。医生在文档上的工作时间占用了他们大量的时间,这影响了他们的患者护理。AI自动摘要功能将这部分时间还给医生,以提高患者的就诊质量和效率。
简化的出院和护理协调进一步改善了结果。Herzog很高兴将这些专为特定目的设计的解决方案集成到他们的平台中,并为超过1亿患者加速影响。
总的来说,弗莱总结了亚马逊云科技如何致力于帮助客户成功构建、扩展和应用生成性人工智能。在为企业开发时,围绕模型、数据、责任、基础设施和应用程序做出明智的选择是实现该技术的全部潜力的关键。
下面是一些演讲现场的精彩瞬间:
领导者展示了多种基础模型如何根据不同应用场景提供不同类型的正确答案。
例如,亚马逊云科技利用Bedrock技术为员工开发了一款机器人,能够迅速回答机组人员的问题,无需查阅文档。
此外,亚马逊云科技还通过HealthScribe和Amazon Bedrock等工具优化了医疗保健流程,使得医护人员能够更专注于患者的治疗成果。
领导者强调,亚马逊云科技与医疗保健提供商之间的紧密合作为通过技术创新改善患者护理提供了关键支持。
总结
亚马逊云科技在re:Invent上举办了一场关于如何利用生成性人工智能更快创新的讲座。主讲人是来自亚马逊云科技AI部门的Bratton Howard。
Howard首先阐述了生成性人工智能正改变员工获取公司数据的方式。他特别强调了名为Amazon Q的一项新的人工智能服务,该服务允许用户对公司数据进行提问、创建内容并自动化任务。
接着,他列出了在企业构建生成性人工智能时需要注意的关键要素:
首先,选择灵活且能满足不同需求的模型。Howard展示了一些各具优劣的不同模型,因此进行测试至关重要。亚马逊云科技Bedrock提供了对可定制的最新模型的访问。
其次,利用公司的数据来区分竞争对手。强大的数据平台推动人工智能创新。亚马逊云科技提供全面的数据服务来存储、查询、分析和操作数据。新的S3连接器加速了基本模型的训练。
第三,整合负责任的人工智能。强大功能需配以适当限制。SageMaker Clarify现已评估基本模型的质量和道德标准。
第四,运用高性能基础设施。亚马逊云科技提供最快的训练和推断速度,以及使用自定义加速器的50%更高的成本效益。SageMaker优化了大语言模型的部署,降低了成本和延迟。
最后,实际应用生成性人工智能。亚马逊云科技HealthScribe通过从患者-医生对话中生成临床摘要,提高了临床生产力。
Howard强调,这些关键要素将帮助企业在构建和扩展生成性人工智能方面取得成功。亚马逊云科技为他们提供了实现这一目标的所需技术和服务。
演讲原文
想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!
2023亚马逊云科技re:Invent全球大会 - 官方网站
点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!
点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!
即刻注册亚马逊云科技账户,开启云端之旅!
【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”
亚马逊云科技是谁?
亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。