一、赛题分析

本次比赛主要是针对大风/雷达回波/降水的短临预报，属于典型的时空序列预测问题，此类问题可以从分类和回归预测两个角度来解决。

按照各气象要素阈值区间进行分类，可以转化为分类预测问题；
从回归预测的角度又分为单变量回归预测和多变量回归预测。

由于大风和降水预测很难转换为分类预测问题，而且我们经过大量的模型试验表明，多变量回归预测很难同时达到最优，且很难超越单变量回归预测。
因此，我们最终采用了单变量回归预测思路，并利用过去一小时数据预测未来两小时各气象要素的时空演变。以下将围绕我们决赛最终采用的模型和策略进行介绍

二、总体设计思路

三、数据预处理

数据清洗：去除雷达回波低值伪影以及异常降水值。
样本重采样和降采样：由于数据分布不平衡问题，根据各要素阈值区间分布情况对样本进行重采样和降采样，以平衡不同强度样本占比。
数据集调整：由于所给的数据集中相邻个例仅相差一帧，重复率过高，因此我们将临近个例的间隔调整为5帧，降低样本重叠率，提升模型训练稳定性。

四、模型选择与优化

风速预测—— `SEResNet`

雷达回波预测模型——`TrajGRU`

降水预测模型：双模型融合

模型一：U2Net

模型二：PhyDNet

双模型融合：两个模型预测结果取平均

五、损失函数

针对不同模型，设计不同损失函数，由于本赛题预测对象均有严重不平衡问题，因此针对MSE和MAE类型损失函数需要给与相应权重设置。而DiceLoss本身仅针对目标区域计算损失，因此无需再给定权重。
此外，针对降水，加入了60/90/120min的累计降水的损失作为正则项。

六、性能提升策略

Two-stage优化：冻结模型部分层，调整损失函数权重，调低学习率，进行模型参数微调，提高强回波/降水的预测技能评分
模型集成：针对降水预测，融合U2Net与PhyDNet预测，提升模型泛化能力和稳定性
偏差订正：考虑了预测能力的时间衰减和阈值的影响，对模型预测进行偏差订正，提高强回波/降水的预测技能评分

七、官方个例真实性

风速预测

雷达回波

降水预测

八、总结

样本不平衡：样本重采样+损失加权和正则/类别不平衡损失+Two-stage优化减轻类别极度不平衡导致的强回波/降水难预测问题
模型性能及稳定性：多模型集成进一步提高降水的整体预报技能评分及模型的稳定性
后处理方法：引入模型预测偏差订正后处理方法提高强回波/降水预报技能评分

本次比赛我们初赛和复赛均为第二，其中复赛实时评测阶段22天大部分时段取得前6成绩，其中10天取得第1，模型总体表现较为稳定

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。