12 月 2 日,有着 “云计算春晚” 之称的亚马逊云科技 re:invent 大会,在美国拉斯维加斯盛大开幕。本届大会以 “Turn your ideas into reality”(让理想发生)为主题,精心筹备了诸多场主题演讲,内容广泛涉及人工智能、数据分析、云计算等一系列关键技术领域,旨在深度剖析行业前沿动态,为从业者及科技爱好者呈上一场知识盛宴。
当下,生成式 AI 赛道持续升温、竞争白热化,亚马逊云科技在该领域的每一步布局,都如同投下巨石,激起行业的千层浪,备受各界瞩目。而此次大会上,AWS 于人工智能板块重磅发力,携一众新技术、新产品与新服务惊艳亮相。
AWS 高级副总裁 Peter DeSantis 在演讲中抛出关键观点:人工智能所承载的海量计算负载,绝非仅靠横向扩展(Scale out)资源就能彻底攻克,纵向扩展单个计算单元的能力(Scale up)同样不可或缺。他进一步指出,构建人工智能基础设施需牢牢依托两大支柱 —— 打造功能更强大的服务器,以及组建规模更大且效率更高的服务器群组。
亚马逊云科技高级副总裁 Peter DeSantis
Amazon Nova 系列:六大模型正式发布
自 2023 年 4 月凭借 Titan 系列模型初涉生成式 AI 战场、崭露头角后,AWS 此番再度亮剑,Amazon Nova 系列自研生成式 AI 多模态模型重磅登场。六大模型宛如六把利剑,精准切入不同领域,解锁多元业务可能,强势搅动行业格局,掀起新一轮变革热潮。
该系列涵盖四个基础大模型版本以及两个独立的内容生成模型。四大基础模型各有所长:纯文本模型 Amazon Nova Micro 具有响应延迟低的特点,其上下文窗口为 128,000 个 token。该模型能够以极低成本实现最低延迟响应,适用于对响应速度要求较高的应用程序。
多模态模型 Amazon Nova Lite 作为成本较低的多模态模型,能够快速处理图像、视频和文本等多种模态的信息,支持 300k 上下文或 30 分钟视频输入。它在速度和成本之间取得了较好的平衡,适合一些对成本较为敏感,但又需要多模态处理能力的轻量级任务。
多模态模型 Amazon Nova Pro 在准确性、速度和成本之间达到了平衡,是较为通用和高效的多模态模型,同样支持 300k 上下文或 30 分钟视频输入,能够出色地处理各种复杂的任务。Amazon Nova Premier 作为功能最强的多模态模型,计划于 2025 年第一季度问世。它将专注于处理复杂推理任务,并能够用作自定义蒸馏模型的教师模型。
2个独立的内容生成模型中,图像生成模型 Amazon nova Canvas 可以根据文本提示生成并编辑专业级别的图像,还提供丰富的配色方案和布局控件,方便用户对生成的图像进行个性化调整。视频生成模型 Amazon Nova Reel 能够根据关键提示词和参考图像生成 6 秒视频,并支持用户调整摄像头运动,如平移、360 旋转和缩放等,未来还会支持 2 分钟视频生成。
Amazon Nova 系列基础大模型
Amazon Bedrock :基础模型托管服务进阶升级
AWS 基础模型托管服务 Amazon Bedrock 同样迎来华丽蜕变。成功整合最新发布的前沿模型后,通过 Amazon Bedrock marketplace,平台现已提供 100 多款专业模型的访问,包括 Mistral Nemo、Falcon RW 等,用户可选择适合自身需求的模型,并通过完全托管的端点在可扩展的 AWS 基础设施上部署它们,还能使用 Bedrock 的 API 进行安全集成。
尤为亮眼的是其全新推出的模型蒸馏功能,允许用户将大型 AI 模型(教师模型)提炼成更小的模型(学生模型),且不会大幅损失准确性。经过蒸馏后的小模型运行速度更快、成本更低,如优化后的模型比原始大型模型快五倍,计算成本低 75%,对于检索增强生成等用例,准确度损失不到 2%,堪称降本增效的神器。
不仅如此,Amazon Bedrock 的智能体现在支持复杂的工作流程,能够管理多个专门的 AI 智能体。跨多个交互的记忆保留特性上线,智能体得以随时间推移学习并适应每个用户的独特需求和偏好。自动推理检查功能同步登场,可以通过交叉引用提供的信息来验证大模型响应是否准确,减少大模型产生幻觉的问题,输出结果更精准、可靠。
基础模型托管服务 Amazon Bedrock
Amazon Sagemaker :机器学习平台再度进化
一直以来,定位为 “基于云计算的机器学习服务” 的 Amazon Sagemaker,此番华丽转身,升级为 “下一代” 平台技术,原 Sagemaker 顺势更名为 “Amazon SageMaker AI”。在之前功能的基础上,又引入了子产品 Amazon SageMaker HyperPod,用于重点优化训练过程中的效率问题。
机器学习平台 Amazon SageMaker
HyperPod 让用户能够更轻松地快速开始训练一些当今最流行的公开可用模型,通过灵活的训练计划节省数周的模型训练时间,并最大限度地提高计算资源利用率,降低高达 40% 的成本。同场发布的 Amazon SageMaker Unified Studio 现已开放预览,用户能够在单一环境中利用所有数据以及用于分析和 AI 的工具进行构建。
Amazon Trainium3:AI训练芯片引领算力革命
AWS 重磅推出新一代 AI 训练芯片 Amazon Trainium3,它是首款采用 3 纳米工艺制造的芯片,专为新一代前沿生成式 AI 工作负载的高性能需求而设计,在性能、能效和密度上树立了新标杆,搭载 Trainium3 的 UltraServers 性能预计将是 Trn2 UltraServers 的 4 倍。按照规划,首批基于 Trainium3 的实例将于 2025 年末正式上线,届时必将掀起新一轮算力革命,赋能 AI 产业迈向更高峰。
AI 训练芯片 Amazon Trainium3
展望前路,随着众多前沿技术与产品逐步落地生根、深度融入市场,必将成为企业发展的 “加速引擎”、行业破局创新的关键力量。作为 AI 普及公益的发起和参与者,我们会始终坚守初心,砥砺前行,让大众共享 AI 能力。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。