名列前茅！百度文心大模型4.5及X1在中国信通院“方升”大模型基准测试中表现优异

百度Geek说

4 月 17 日上海

阅读 2 分钟

0

中国人工智能产业发展联盟（以下简称“AIIA”）紧密跟踪大模型和智能体的技术发展与行业应用动态，构建并发布了“方升”（FactTesting）大模型基准测试体系，自2024年以来已对国内外开源与闭源大模型开展了6轮能力监测，累计测试了200余个大模型，持续跟踪其技术演进与表现，为行业技术选型与能力评估提供了重要依据。2025年，评测范围进一步扩展至多模态理解、文生图、文生视频等领域，并率先开展智能体测试的研究与实践，初步构建了智能体测试验证平台，为产业界提供全面的技术评估参考。

2025年4月9日，在南京召开的中国人工智能产业发展联盟第十四次全体会议上，中国人工智能产业发展联盟正式发布“方升”大模型基准测试结果（2025年1季度）。

“方升”大模型基准测试结果发布现场

在权威发布环节，AIIA 总体组组长、中国信通院人工智能研究所所长魏凯发布了“方升”人工智能基准测试结果及测试观察。在大语言模型测试结果中，文心大模型4.5在基础能力结果、文心大模型X1在推理能力结果中均名列前茅。

大语言模型-基础能力测试结果

大语言模型-推理能力测试结果

3月16日，百度正式发布文心大模型4.5和文心大模型X1。

文心大模型4.5是百度自主研发的新一代原生多模态基础大模型，通过多个模态联合建模实现协同优化，多模态理解能力优秀；具备更精进的语言能力，理解、生成、逻辑、记忆能力全面提升，去幻觉、逻辑推理、代码能力显著提升。

文心大模型X1具备更强的理解、规划、反思、进化能力，并支持多模态，是首个自主运用工具的深度思考模型。作为能力更全面的深度思考模型，文心大模型X1兼备准确、创意和文采，在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

文心一言官网

目前，两款模型已在文心一言官网上线，免费向用户开放。（_https://yiyan.baidu.com_）

2025是大模型技术全面迭代的一年，百度将在人工智能、数据中心、云基础设施上更大胆地投入，打造更好、更智能的下一代模型。

----------END----------

推荐阅读

飞桨新一代框架3.0正式发布：加速大模型时代的技术创新与产业应用

即刻体验！文心大模型X1现面向企业用户全面开放！

一篇论文，看见百度广告推荐系统在大模型时代的革新

前沿多模态模型开发与应用实战3：DeepSeek-VL2多模态理解大模型算法解析与功能抢先体验

秒哒首发即爆发！上线首日吸引2万用户，打造3万应用！

阅读 486发布于 4 月 17 日

百度Geek说

246 声望54 粉丝

« 上一篇

飞桨新一代框架3.0正式发布：加速大模型时代的技术创新与产业应用

下一篇 »

千亿级打点PV的成本治理实践

引用和评论

推荐阅读

深入浅出DDD：从理论到落地的关键

百度Geek说阅读 237

百度 Create AI 开发者大会：李彦宏发布两大新模型、多款热门 AI 应用，帮助开发者全面拥抱 MCP

思否编辑部阅读 4.7k

千亿级打点PV的成本治理实践

百度Geek说阅读 1.6k

两连发！文心大模型4.5及X1，上线千帆！

百度Geek说阅读 642

图灵数据洞察平台-TDF（Turing Data Finder）

百度Geek说阅读 487

百度大模型产品与技术生态（2025年5月）

vistart阅读 459

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。