人工智能平台+光明电力大模型 实际测试中的思考（一）

PowerData

编者荐语：

来自PowerData李钊丞同学的精彩分享！！

以下文章来源于阿丞的数据漫谈，作者阿阿丞

[

阿丞的数据漫谈 .

聚焦数据及人工智能领域，不定期分享能源行业知识、数据科学、学习笔记等。尽可能All in 原创。

](#)

HELLO 更多趣文请关注阿丞的数据漫谈

什么是光明电力大模型？

光明电力大模型是由国家电网有限公司发布的国内首个千亿级多模态电力行业大模型。这个模型被视为能源电力领域的人工智能“专家”，旨在为电网的安全稳定运行、促进新能源消纳以及提升供电服务质量提供强大的技术支持。

千亿级参数：该模型拥有达到千亿级别的参数规模，这显著提升了其推理能力，使其能够处理更为复杂的任务和数据集。
多模态融合：光明电力大模型实现了文字、图片、视频等多种形态数据的融合分析，增强了模型的数据分析能力，能够更全面地理解和处理信息。
专业能力强：它覆盖了电力行业的丰富数据类型，包括文本、图像、视频、语音、时序和拓扑等，并且包含了广泛的标准、规程、制度和规范等经验知识，具有最全、最强的专业能力。
应用场景广泛：光明电力大模型可以应用于电力生产的多个环节，如规划、运维、运行、客户服务等，提供智能化服务，例如精准诊断重过载问题、自动生成设备体检报告、快速生成负荷转供策略以及实现供电方案的智能编制等。
权威认证：经过中国信通院和电子标准院的检测，光明电力大模型的专业能力达到了最高等级“卓越级”，证明了其在电力知识记忆理解、多模态融合分析等方面的优越性能。

顶层设计

战略目标层

核心使命：以“人工智能+”行动为导向，解决新能源消纳、复杂系统优化等传统技术难题，推动电力行业智能化转型。

总体规划：基于“6541”布局（六大业务领域、五大技术能力、四大核心要素、一套保障体系），实现技术与业务的深度融合。

核心能力层

多模态融合：

通过电力跨模态适配层，将文本、图像、电网拓扑、时序数据映射到统一语义空间，提升跨模态分析能力。
采用混合注意力机制，支持设备状态与气象数据的联合推理（如台风天气故障预警）。

知识增强：

构建行业最大样本库，由千名专家标注，知识密度提升40%。
分阶段训练策略（理论→规程→运行分析），训练效率提升30%。

动态推理优化：

Zero-Token Transformer（ZTT）架构：通过动态退出机制减少30%计算资源消耗，适配云边端部署
支持电力业务逻辑链式推理（如“特征提取→拓扑分析→故障诊断”）

“6451”布局

六大业务领域

规划建设：

新型配电网智能诊断与规划：电网智能诊断分析、电力供票智能顶测、电网规划方案智能生成等。

电网运行：

电力智能仿真分析与调度运行：仿真智能计算及在线安全智能分析、调度运行智能辅助决策等。
配电网源荷预测及智能辅助决策：配网分布式光伏与负荷智能预测、配网负荷转供方案智能生成等。

设备管理：

电力主设备状态评价及智能运维：主设备状态智能诊断评估、变电状态检修智能决策等。

作业管控：

电力设备检修作业智能管控：变电检修作业智能辅助、检修工作票智能生成与执行督察等。

客户服务：

电力客户全过程智能服务：智能客户服务、供电方案智能生成、供电服务智能派单等。

经营管理：

数字化建设智能研发与运维：数字化系统智能运维、数字化系统研发代码智能分析等。
供应链全环节智能协同服务：招投标文件智能生成、监造报告智能生成等。

五大技术能力

感知智能：多模态数据融合分析（文本、图像、电网拓扑等），实现设备状态实时感知。

认知智能：行业知识图谱构建（亿级实体关系），理解电力规程与机理。

决策智能：基于强化学习的调度策略优化。

具身智能：无人机/机器人自主巡检与操作，替代人工高危作业。

科学智能（AI for Science）：解决新能源并网的高维仿真难题。

四大核心要素

样本库：行业最大高质量样本库，含40%电力专业数据。

算力：国产智算中心支撑，整合省级超算中心。

平台：开放共享的AI中台，支持云边端协同计算。

模型：千亿级Transformer架构，动态激活亿级至千亿级参数模型。

一套保障体系：

横向协同：联合百度、阿里等科技企业，共建算力与算法资源。

纵向贯通：总部与省公司联动，实现“平台共用、模型共训”。

光明电力大模型部署模式

光明电力大模型部署于国网人工智能平台，涵盖研发仿真环境、信息内网以及信息外网三套环境。从整体架构规划而言，光明电力大模型处于中台层，采用两级部署模式，能够为应用层六大业务领域的各类应用提供一站式、全生命周期的模型服务能力。

在平台的管理规范方面，原则上各网省公司不允许另行自建平台以及部署模型，所有的模型都必须先注册在国网人工智能平台之后，才能够提供模型服务能力。国网人工智能平台整体划分为两个系列集群，分别为文心系列集群和通义系列集群，应用层可根据实际需求在平台中灵活创建并调用相应的模型。

光明电力大模型能力边界

技术边界

数据依赖性

结构化数据依赖：模型精度与电力GIS拓扑、设备台账等结构化数据强相关，数据噪声或标注错误可能导致关键参数误判（如变压器负载率偏差＞15%）
跨模态泛化局限：在缺乏多源数据（如气象数据与设备红外图像融合）的场景下，新能源功率预测误差率可能从5%上升至20%
隐私合规风险：涉及用户用电行为数据时，需通过联邦学习实现"数据可用不可见"，否则可能违反《个人信息保护法》

实时性瓶颈