IBM 和 NASA 训练了首个用于太阳物理学的基础模型

主要观点:IBM 和 NASA 创建了 366M 参数的 Surya 模型用于预测太阳活动,包括耀斑事件、太阳风及太阳爆发的前兆,对太空宇航员安全和地面系统如通信、电力分配等有重要影响。
关键信息

  • 基于 NASA 太阳动态观测站 9 年全分辨率(4096x4096 像素)、12 分钟间隔的图像训练。
  • 与以往专注于特定任务的模型不同,是更通用的太阳物理学方法。
  • 虽非任务特定,但性能超现有专门模型。
  • 架构采用 2-D 变压器加两个频谱门控块、八个长短注意力块和一个解码器块。
  • 两个频谱门控块可抑制噪声增强特征,长短注意力块能捕获多尺度表示,解码器块可映射回物理域。
  • 研究人员称其能形成一定程度上物理感知的表示,无需额外训练可预测太阳动力学。
    重要细节
  • 模型在 Hugging Face 和 GitHub 上可用。
  • 引用了相关研究论文以了解各阶段转换的详细信息。
阅读 191
0 条评论