9月12日,由工业和信息化新闻宣传中心承办的“算力服务高质量发展论坛”在2024中国国际服务贸易交易会期间召开,九章云极DataCanvas公司AI首席科学家缪旭受邀出席论坛,并发表“大模型后训练时代的算力服务思考”主旨演讲。
本次论坛以“以算凝力,融创未来”为主题,汇聚来自政、产、学、研界多位重量嘉宾,剖析算力产业最发展新趋势,分享算力基础设施建设实践经验,共同探讨算力服务高质量发展之道。
论坛上,缪旭先生在演讲中表示,随着基础模型面临的挑战不断升级与复杂化,大模型后训练模式正在崛起,成为应对上述挑战的关键路径。然而后训练模式的复杂性与高度定制化需求,对算力资源的精准调度、灵活配置和高效利用提出了前所未有的高标准挑战,企业亟需高质量、高效能、更经济、更好用的算力服务新范式。
九章云极DataCanvas公司AI首席科学家缪旭发表演讲
更自动、更高效、更精准,大模型后训练模式崛起
缪旭指出,当前基础模型发展迅猛,拥有广泛的行业应用潜力,但也面临着提示词工程复杂度高、难以规避的幻觉问题、规划能力不足以及高昂的成本负担等核心挑战。缪旭表示,通过大模型后训练策略的补足,可以有效应对上述瓶颈。
大模型后训练的核心策略为,在大模型基础训练完成后,通过使用新的数据集或任务对模型进行再次训练,以提高模型的适应性和性能。这个过程通常包含提示词设计、模型微调、embedding优化及调度优化等多个环节。
具体而言,大模型后训练的过程如下:将复杂的业务逻辑梳理并封装成独立的、可管理的任务模块;随后针对每个单一任务模块实施精准的后训练微调,以增强其针对特定任务的适应性和性能。在完成模块集成重组后,结合业务系统及用户的互动反馈,持续进行自我学习和自我增强,最终实现模型性能自动、高效的持续提升。
大模型后训练方法的补足
新标准、新需求、新模式,普惠算力开启AI新时代
在大模型后训练的过程中,算力调度尤为关键,包括训练期的数据准备调度、微调任务编排,以及推理阶段的动态加载和异构算力管理。通过在调度过程中引入可训练的调度模型,在优化目标时增加效率和成本计算,结合线上、线下收集的数据持续优化调度模型,可以从软件层面有效提升算力调度能力,并降低计算成本,使算力应用更加贴近实际应用场景。
不同任务工作流的安排调度
在数据存储与处理的关键环节,大模型后训练模式对系统的安全性提出了更高要求,以确保算力资源能够无缝且安全地融入各类业务系统。依托业务系统与互联网的海量数据资源,以任务为驱动,大模型可以智能识别任务需求,自动收集并处理所需数据,生成高质量的微调数据集。此外,应用存算一体架以构可以有效降低数据传输的带宽消耗,提升数据处理的整体效率与安全性。
面对不同行业、不同场景的多样化大模型后训练需求,基于Alaya NeW高效的算力管理内核,九章云极DataCanvas公司提出国际首创的算力服务新范式,凭借统一性能基准、资源管理优化、方便估算成本收益、算力一体化等优势,提出了统一的算力服务计量单位“度”(DCU),并用其实现标准化的算力计量计费,让算力消费者轻松获得好用、经济、普惠的算力服务,实现算力资源0浪费。此外,通过提供完整的大模型+Agent开发工具链,Alaya NeW为各行业用户提供灵活的大模型和AI Agent定制能力,加速人工智能技术在各领域的深度融合与广泛应用。
作为国内领先的人工智能基础设施提供商,九章云极DataCanvas公司将继续坚持AI技术的自主创新,以领先的AI智算产品推动算力服务向更高质量、更高水平迈进,深度赋能千行百业的数智化转型。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。