本文来自微信公众号“学术头条”,【作者】阮文韵。
来自世界气象组织(WMO)的数据显示,在过去50年里,平均每天都会发生一场与天气、气候或水患有关的灾害,每天造成115人死亡、2.02亿美元的经济损失。
因此,构建更准确的天气预报系统,将有助于挽救数百万人的生命,减少数万亿美元的经济损失,意义重大。
然而,传统的天气预报依赖数值天气预报算法(NWP),计算复杂度高、模型构建耗时,难以快速生成预报结果。基于机器学习的天气预报(MLWP)在效率和单次预报准确性上虽有所突破,但在量化预报不确定性和处理复杂时空相关性方面表现不足,表现不及NWP集成预报系统。
如今,由Google DeepMind研究团队开发的人工智能(AI)模型GenCast,将天气预报的精度与效率带入了一个崭新的阶段——
GenCast能够在8分钟内生成一组随机的15天全球预报,时间步长为12小时,分辨率达0.25°,覆盖超过80种地表和大气变量,在97.2%的评估指标(共计1320个指标)上都优于当前全球最好的中期预报——欧洲中期天气预报中心(ECMWF)的集合预报(ENS),而且具有更好的边际和联合预报分布。
另外,GenCast在预报极端天气(如高温、强风)、热带气旋路线和风能产量时,也更加有效。
相关研究论文以“Probabilistic weather forecasting with machine learning”为题,已发表在权威科学期刊Nature上。
GenCast:更快、更准预报未来天气
GenCast是一个全新的概率天气预报模型,通过条件扩散模型(conditional diffusion model)生成一系列可能的天气场景。其核心能力在于建模未来天气状态的条件概率分布,即基于当前和之前的天气状态生成未来的预报。这一方式允许GenCast以更快的速度和更高的精度提供全球范围15天概率性天气预报。
具体而言,GenCast的架构包括编码器、处理器和解码器三大模块。编码器将初始天气状态映射到一个经过6次精细划分的球形网格上,处理器则通过图transformer在网格节点间捕捉复杂的时空相关性,而解码器则将结果重新映射回全球纬经度网格,生成最终的天气预报。
图|GenCast生成天气预报的示意图。
此外,研究团队利用ERA5再分析数据对GenCast进行了训练,这一数据集包含40年间全球范围内的最佳天气估计分析结果,确保了模型的泛化能力和对历史天气模式的深度理解。
为评估GenCast的实际性能,研究团队对其进行了基准测试,并将其与当前最先进的系统和模型进行对比。为确保公平对比,所有模型均基于ERA5数据进行初始化,并统一分辨率至0.25°。
在与其他系统对比的实验中,GenCast生成的天气样本更接近实际观察值,预报分布覆盖了可能的多种情景,为用户提供了对潜在风险的更全面理解。例如,GenCast在台风海贝思登陆日本前不久的预报非常清晰,在1-15天的预估时间内,其球谐功率谱与ERA5地面真实值非常接近。
之后,研究团队评估了GenCast和ENS在极端天气预报方面的整体预报技能、校准和性能,即边际预报性能。边际预报作为对某一时间和地点的天气状况进行的具体预报,是日常天气服务的核心。
GenCast在这一领域展现了强大的性能优势。其生成的预报分布能够更精确地反映可能的天气情景,不仅在温度、风速和气压等变量的预报上与真实数据高度吻合,还能通过改进的概率校准有效量化预报的不确定性。
具体研究显示,GenCast在多个气象变量的边际分布预报中表现优于ENS,在一个涵盖1320个评估目标的测试中,GenCast在97.2%的情况下取得更高的技能得分(CRPS),特别是在短期预报(1至5天)中效果显著。
同时,GenCast在预报高温、强风等极端天气时同样表现卓越。研究采用Brier技能得分和相对经济价值(REV)曲线衡量模型性能。结果显示,在预报高温(99.99%分位点)和极端低温(0.01%分位点)事件时,GenCast的表现显著优于ENS。
此外,GenCast的边际分布预报展现了良好的校准能力,这意味着它能够准确地识别预报中可能存在的错误或偏差,为用户提供更可靠的天气决策支持。
图|GenCast的边际预报分布娴熟且校准良好。
除了边际预报,GenCast在联合预报方面也展现了令人瞩目的表现。联合预报关注天气变量间的空间和时间相关性,对于捕捉全局天气系统的动态特性至关重要。
例如,在热带气旋轨迹预报方面,对热带气旋的路径预报不仅依赖单一变量,还需考虑多层次的大气相互作用。而GenCast能够生成具有时空一致性的天气样本,精准地捕捉这些复杂的相关性,从而生成精确预报。
研究特别分析了GenCast在台风“海贝思”案例中的表现。台风轨迹预报显示,GenCast的不确定性评估范围覆盖了更多可能的情景,其在轨迹位置预报上的误差显著低于ENS。更重要的是,随着预报时间的缩短,GenCast的不确定性范围逐步收敛,为决策者提供了更精确的着陆时间和地点信息。
除此之外,在区域风能预报中,GenCast将10米风速数据转化为风能输出,其预报精度较ENS提高了20%,尤其在短时间尺度上,为可再生能源调度提供了新的可能性。
图|GenCast在区域风力和热带气旋预报方面优于ENS。
尽管GenCast在精度与效率上实现了双重突破,但仍有进一步优化空间。例如,提高分辨率以匹配未来升级的ENS系统,或者通过蒸馏技术降低计算成本。此外,结合操作性数据进行微调或融入更多传统NWP的初始条件处理方法,亦可显著提升其实用性。
AI如何重塑气候预报未来?
AI作为“一个改善极端天气预报的更快、更便宜的替代方案”,一向在天气预报领域被寄予厚望,除了谷歌,包括华为、清华大学等在内的科技公司和高校在这一方向均取得了重大进展。
2023年7月,由华为云开发的盘古气象(Pangu-Weather)模型登上了Nature,其使用39年的全球再分析天气数据作为训练数据,预报准确率与全球最好的数值天气预报系统IFS相当,且在相同的空间分辨率下比IFS快10000倍以上。(点击查看详情)
同期发表在Nature上的另一篇论文则介绍了NowcastNet,其出自机器学习领域泰斗、加州大学伯克利分校教授Michael Jordan和清华大学教授王建民领导的研究团队,该模型可以结合物理规律和深度学习,进行实时预报降水。NowcastNet在临近预报方面表现出色,基于雷达观测数据,可以做到提前3小时对2048 km×2048 km的区域进行高分辨降水预报。
2023年11月,Google DeepMind推出了一款基于机器学习的天气预报模型——GraphCast,在全球0.25°的分辨率下,该模型可以在一分钟内预报未来10天的数百个天气变量,显著优于传统气象预报方法,同时在预报极端事件方面表现良好。相关研究论文已发表在权威科学期刊Science上。(点击查看详情)
2024年3月,Google Research洪水预报团队开发了一种AI模型,其利用5680个测量仪数据训练,可在7天内预报未测量流域的日径流。该模型在同日预报和5年一遇极端天气事件的预报中,表现优于当时领先的全球洪水预警系统GloFAS。相关研究论文已发表在权威科学期刊Nature上。(点击查看详情)
2024年7月,Google Research团队及其合作者推出了一款天气预报和气候模拟模型NeuralGCM,在1-15天短期天气预报中的准确率媲美ECMWF模型,并在气旋预报和轨迹模拟上表现优于现有模型。加入海平面温度后,该模型的40年气候预报结果与全球变暖趋势高度一致。且NeuralGCM可以在30秒计算时间内生成22.8天大气模拟。相关研究论文已发表在权威科学期刊Nature上。(点击查看详情)
相信在不久的将来,AI驱动的天气预报将以更快的速度与更高的准确率在灾害预警、能源规划和气候适应等方面发挥更大的作用,为人类应对日益复杂的气候挑战提供更强大的工具。
论文链接:https://www.nature.com/articles/s41586-024-08252-9