关联比赛:  2022江苏气象AI算法挑战赛-AI助力强对流天气预报

2022江苏气象AI算法挑战赛亚军比赛攻略_DontMind队

成员介绍

enter image description here

一、赛题分析

本次比赛主要是针对大风/雷达回波/降水的短临预报,属于典型的时空序列预测问题,此类问题可以从分类和回归预测两个角度来解决。

  • 按照各气象要素阈值区间进行分类,可以转化为分类预测问题;
  • 从回归预测的角度又分为单变量回归预测和多变量回归预测。

由于大风和降水预测很难转换为分类预测问题,而且我们经过大量的模型试验表明,多变量回归预测很难同时达到最优,且很难超越单变量回归预测。因此,我们最终采用了单变量回归预测思路,并利用过去一小时数据预测未来两小时各气象要素的时空演变。以下将围绕我们决赛最终采用的模型和策略进行介绍

enter image description here

二、总体设计思路

enter image description here

三、数据预处理

数据清洗: 去除雷达回波低值伪影以及异常降水值。样本重采样和降采样: 由于数据分布不平衡问题,根据各要素阈值区间分布情况对样本进行重采样和降采样,以平衡不同强度样本占比。数据集调整: 由于所给的数据集中相邻个例仅相差一帧,重复率过高,因此我们将临近个例的间隔调整为5帧,降低样本重叠率,提升模型训练稳定性。

enter image description here

四、模型选择与优化

风速预测—— SEResNet

enter image description here

雷达回波预测模型——TrajGRU

enter image description here

降水预测模型:双模型融合

模型一:U2Net

enter image description here

模型二:PhyDNet

enter image description here

双模型融合:两个模型预测结果取平均

五、损失函数

enter image description here

针对不同模型,设计不同损失函数,由于本赛题预测对象均有严重不平衡问题,因此针对MSE和MAE类型损失函数需要给与相应权重设置。而DiceLoss本身仅针对目标区域计算损失,因此无需再给定权重。此外,针对降水,加入了60/90/120min的累计降水的损失作为正则项。

六、性能提升策略

  • Two-stage优化: 冻结模型部分层,调整损失函数权重,调低学习率,进行模型参数微调,提高强回波/降水的预测技能评分
  • 模型集成: 针对降水预测,融合U2Net与PhyDNet预测,提升模型泛化能力和稳定性
  • 偏差订正: 考虑了预测能力的时间衰减和阈值的影响,对模型预测进行偏差订正,提高强回波/降水的预测技能评分

enter image description here

七、官方个例真实性

风速预测

enter image description here

 

enter image description here

雷达回波

enter image description here

 

enter image description here

降水预测

enter image description here

 

enter image description hereenter image description here

 

enter image description here

八、总结

  • 样本不平衡: 样本重采样+损失加权和正则/类别不平衡损失+Two-stage优化减轻类别极度不平衡导致的强回波/降水难预测问题
  • 模型性能及稳定性: 多模型集成进一步提高降水的整体预报技能评分及模型的稳定性
  • 后处理方法: 引入模型预测偏差订正后处理方法提高强回波/降水预报技能评分

enter image description here

本次比赛我们初赛和复赛均为第二,其中复赛实时评测阶段22天大部分时段取得前6成绩,其中10天取得第1,模型总体表现较为稳定

查看更多内容,欢迎访问天池技术圈官方地址:2022江苏气象AI算法挑战赛亚军比赛攻略_DontMind队_天池技术圈-阿里云天池

阿里云天池
51 声望14 粉丝