世界气象组织(WMO)的数据显示,过去50年里,平均每天都会发生一次天气、气候或水相关的灾害,每次事件造成约115人死亡和2.02亿美元的经济损失。
更令人担忧的是,近年来,人类活动加速的气候变化导致热浪、寒潮、强降水和干旱等极端天气和气候灾害异常增加。
因此,及时准确的天气预报和气候模拟不仅可以每年挽救数万人的生命,还能减少极端天气和气候事件对人类社会和生态系统的灾难性影响。
现在,由谷歌研究团队及其合作者开发的人工智能(AI)模型NeuralGCM将天气预报和气候模拟提升到了新的水平:
- NeuralGCM在1-15天预报的准确性与拥有世界最先进传统物理天气预报模型的欧洲中期天气预报中心(ECMWF)相当。
- 对于10天的提前预报,NeuralGCM的表现与现有AI模型相当或更好。
- 在包含海表温度的情况下,NeuralGCM的40年气候预测结果与ECMWF数据中发现的全球变暖趋势一致。
- NeuralGCM在预测气旋及其轨迹方面也优于现有气候模型。
值得注意的是,NeuralGCM不仅在准确性上匹配或超越了现有的传统数值天气预报模型和其他机器学习(ML)模型,而且速度显著更快,能够在30秒的计算时间内生成22.8天的大气模拟。与传统模型相比,它还可以节省数量级的计算资源。
相关研究论文题为"用于天气和气候的神经一般环流模型",已发表在权威科学期刊《自然》上。
这些结果共同表明,NeuralGCM可以生成确定性天气、天气和气候集合预报,显示出足够的稳定性,可用于长期天气和气候模拟。
研究团队认为,这种端到端的深度学习方法与传统一般环流模型(GCMs,代表大气、海洋和陆地中的物理过程,是天气和气候预测的基础)所执行的任务兼容,可以增强对理解和预测地球系统至关重要的大规模物理模拟。
此外,NeuralGCM的混合建模方法可应用于其他科学领域,如材料发现、蛋白质折叠和多物理工程设计。
减少长期预报的不确定性和估计极端天气事件是理解气候缓解和适应的关键。
长期以来,ML模型被认为是天气预测的替代手段,具有节省计算成本的优势。它们甚至在确定性天气预报中达到或超过了大气环流模型的水平。然而,它们在长期预报中的表现往往不如大气环流模型。
在这项工作中,研究团队通过结合机器学习和物理方法设计了NeuralGCM,使用ML组件替换或纠正GCMs中的传统物理参数化方案。它由以下关键部分组成:
-
可微分动力核心:该核心负责求解离散化的动力方程,模拟受重力、科里奥利力等因素影响的大尺度流体运动和热力学过程。动力核心使用水平伪谱离散化和垂直σ坐标,并使用JAX库实现,支持自动微分。它模拟七个预报变量:水平风涡度、水平风散度、温度、地表压力和三种水物质(比湿、冰云水含量和液态云水含量)。
-
学习物理模块:该模块使用GCMs中的单柱方法,仅使用单个大气柱的信息来预测该柱内未解析过程的影响。它使用带有残差连接的全连接神经网络,在所有大气柱之间共享权重。神经网络的输入包括大气柱中的预报变量、总入射太阳辐射、海冰浓度和海表温度,以及预报变量的水平梯度。神经网络的输出是预报变量趋势,按目标场的无条件标准差进行缩放。
-
编码器和解码器:由于ERA5数据以压力坐标存储,而动力核心使用σ坐标系统,因此需要编码器和解码器进行转换。这些组件在压力层和σ坐标层之间执行线性插值,并使用与学习物理模块相同的神经网络架构进行校正。编码器可以消除由初始化冲击引起的重力波,从而避免污染预测结果。
结果表明,NeuralGCM在天气预测方面展现出强大的能力,在超短期、短期和中期时间尺度上与最先进的模型相当。例如:
超短期预测(0-1天):
- 泛化能力:与GraphCast相比,NeuralGCM在未训练的天气条件下表现更好,因为它使用局部神经网络来预测大气垂直柱中的物理过程。
短期预测(1-10天):
- 准确性:在1-3天的短期预测中,NeuralGCM-0.7°和GraphCast表现最佳,准确跟踪天气模式的变化。
- 物理一致性:与其他机器学习模型相比,NeuralGCM的预测更清晰,避免了物理上不一致的模糊预测。
- 可解释性:通过诊断降水减蒸发,NeuralGCM的结果更具可解释性,有助于水资源分析。
- 地转风平衡:与GraphCast相比,NeuralGCM更准确地模拟了地转风及其垂直结构和比率。
中期预测(7-15天):
- 集合预报:1.4°分辨率的NeuralGCM-ENS具有比ECMWF-ENS更低的集合平均RMSE、RMSB和CRPS误差,表明它能更好地捕捉可能的平均天气状态。
- 可校准性:NeuralGCM-ENS的集合预报,像ECMWF-ENS一样,具有约为1的离散度-技巧比,这是校准预报的必要条件。
除了在天气预测方面表现出色外,NeuralGCM在气候模拟方面也展现出强大的能力,包括季节循环模拟、热带气旋模拟和历史温度趋势模拟。例如:
季节循环模拟:
- 准确性:NeuralGCM能准确模拟季节循环,包括全球可降水量和全球总动能的年循环,以及哈德利环流和纬向平均风等关键大气动力学。
- 与全球云解析模型的比较:与全球云解析模型X-SHiELD相比,NeuralGCM在可降水量方面的偏差更小,在热带地区的温度偏差更低。
热带气旋模拟:
- 轨迹和数量:即使在1.4°的粗分辨率下,NeuralGCM也能产生与ERA5相似的热带气旋轨迹和数量,而全球云解析模型X-SHiELD在1.4°分辨率下低估了热带气旋的数量。
历史温度趋势模拟:
- AMIP模拟:NeuralGCM-2.8°进行了40年的AMIP模拟。结果显示,所有模拟都准确捕捉到ERA5数据中观察到的全球变暖趋势,年际温度趋势与ERA5数据有很强的相关性,表明NeuralGCM能有效模拟海温强迫对气候的影响。
- 与CMIP6模型的比较:与CMIP6 AMIP模型相比,NeuralGCM-2.8°在1981-2014年期间的温度偏差更小,即使在去除CMIP6 AMIP模型的全球温度偏差后也是如此。
尽管NeuralGCM在天气和气候预测方面展现出强大的能力,但它仍然存在一些局限性:
-
预测未来气候的能力有限:NeuralGCM目前无法预测与历史气候显著不同的未来气候。当海表温度(SST)显著增加(如+4K)时,NeuralGCM的响应与预期不一致,并出现气候漂移。
-
模拟未观测气候的能力不足:与其他机器学习气候模型一样,NeuralGCM在模拟未观测的气候方面也面临挑战,如未来气候或与历史数据显著不同的气候。这需要模型具有更强的泛化能力和更先进的训练策略,如对抗训练或元学习。
-
物理约束和数值稳定性问题:例如,NeuralGCM的谱分布仍比ECMWF物理预报更模糊,在模拟极端天气事件时仍存在一些数值稳定性问题。