主要观点:IBM 和 NASA 创建了 366M 参数的 Surya 模型用于预测太阳活动,包括耀斑事件、太阳风及太阳爆发的前兆,对太空宇航员安全和地面系统如通信、电力分配等有重要影响。
关键信息:
- 基于 NASA 太阳动态观测站 9 年全分辨率(4096x4096 像素)、12 分钟间隔的图像训练。
- 与以往专注于特定任务的模型不同,是更通用的太阳物理学方法。
- 虽非任务特定,但性能超现有专门模型。
- 架构采用 2-D 变压器加两个频谱门控块、八个长短注意力块和一个解码器块。
- 两个频谱门控块可抑制噪声增强特征,长短注意力块能捕获多尺度表示,解码器块可映射回物理域。
- 研究人员称其能形成一定程度上物理感知的表示,无需额外训练可预测太阳动力学。
重要细节: - 模型在 Hugging Face 和 GitHub 上可用。
- 引用了相关研究论文以了解各阶段转换的详细信息。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。