世界氣象組織(WMO)的數據顯示,過去50年來,平均每天都會發生一次天氣、氣候或水相關的災害,每次事件造成約115人死亡和2.02億美元的經濟損失。
更令人擔憂的是,近年來由人類活動加速的氣候變化導致熱浪、寒潮、強降水和乾旱等極端天氣和氣候災害異常增加。
因此,及時準確的天氣預報和氣候模擬不僅每年可以幫助挽救數萬人的生命,還能減少極端天氣和氣候事件對人類社會和生態系統的災難性影響。
現在,由Google Research團隊及其合作夥伴開發的人工智能(AI)模型NeuralGCM將天氣預報和氣候模擬提升到了新的水平:
- NeuralGCM在1-15天預報的準確性與擁有世界最先進傳統物理天氣預報模型的歐洲中期天氣預報中心(ECMWF)相當。
- 對於10天的提前預報,NeuralGCM的表現與現有AI模型相當或更好。
- 在包含海表溫度的情況下,NeuralGCM的40年氣候預測結果與ECMWF數據中發現的全球變暖趨勢一致。
- NeuralGCM在預測氣旋及其軌跡方面也優於現有氣候模型。
值得注意的是,NeuralGCM不僅在準確性上匹配或超越了現有的傳統數值天氣預報模型和其他機器學習(ML)模型,而且速度顯著更快,能夠在30秒的計算時間內生成22.8天的大氣模擬。與傳統模型相比,它還可以節省數量級的計算資源。
相關研究論文題為《用於天氣和氣候的神經通用環流模型》,已發表在權威科學期刊《自然》上。
這些結果共同表明,NeuralGCM可以生成確定性天氣、天氣和氣候集合預報,顯示出足夠的穩定性,可用於長期天氣和氣候模擬。
研究團隊認為,這種端到端的深度學習方法與傳統通用環流模型(GCMs,用於表示大氣、海洋和陸地中的物理過程,是天氣和氣候預測的基礎)所執行的任務相容,可以增強對理解和預測地球系統至關重要的大規模物理模擬。
此外,NeuralGCM的混合建模方法可以應用於其他科學領域,如材料發現、蛋白質折疊和多物理工程設計。
減少長期預報的不確定性和估計極端天氣事件是理解氣候緩解和適應的關鍵。
ML模型長期以來被認為是天氣預測的替代手段,具有節省計算成本的優勢。它們甚至在確定性天氣預報中達到或超過了大氣環流模型的水平。然而,它們在長期預報中的表現通常不如大氣環流模型。
在這項工作中,研究團隊通過結合機器學習和物理方法設計了NeuralGCM,使用ML組件來替換或修正GCMs中的傳統物理參數化方案。它由以下關鍵部分組成:
-
可微分動力核心:該核心負責求解離散化的動力方程,模擬受重力、科里奧利力等因素影響的大尺度流體運動和熱力學過程。動力核心使用水平偽譜離散化和垂直σ坐標,並使用JAX庫實現,支持自動微分。它模擬七個預報變量:水平風渦度、水平風散度、溫度、地表壓力和三種水物質(比濕、冰雲水含量和液態雲水含量)。
-
學習物理模塊:該模塊使用GCMs中的單柱方法,僅使用單個大氣柱的信息來預測該柱內未解析過程的影響。它使用具有殘差連接的全連接神經網絡,在所有大氣柱之間共享權重。神經網絡的輸入包括大氣柱中的預報變量、總入射太陽輻射、海冰濃度和海表溫度,以及預報變量的水平梯度。神經網絡的輸出是預報變量趨勢,按目標場的無條件標準差進行縮放。
-
編碼器和解碼器:由於ERA5數據以壓力坐標存儲,而動力核心使用σ坐標系統,因此需要編碼器和解碼器進行轉換。這些組件在壓力層和σ坐標層之間執行線性插值,並使用與學習物理模塊相同的神經網絡架構進行修正。編碼器可以消除由初始化衝擊引起的重力波,從而避免污染預測結果。
結果顯示,NeuralGCM在天氣預測方面展現出強大的能力,在超短期、短期和中期時間尺度上與最先進的模型相當。例如:
超短期預測(0-1天):
- 泛化能力:與GraphCast相比,NeuralGCM在未經訓練的天氣條件下表現更好,因為它使用局部神經網絡來預測大氣垂直柱中的物理過程。
短期預測(1-10天):
- 準確性:在1-3天的短期預測中,NeuralGCM-0.7°和GraphCast表現最佳,準確追踪天氣模式的變化。
- 物理一致性:與其他機器學習模型相比,NeuralGCM的預測更清晰,避免了物理上不一致的模糊預測。
- 可解釋性:通過診斷降水減蒸發,NeuralGCM的結果更具可解釋性,有助於水資源分析。
- 地轉風平衡:與GraphCast相比,NeuralGCM更準確地模擬地轉風及其垂直結構和比例。
中期預測(7-15天):
- 集合預報:1.4°分辨率的NeuralGCM-ENS具有較低的集合平均RMSE、RMSB和CRPS誤差,比ECMWF-ENS更能捕捉可能的平均天氣狀態。
- 可校準性:NeuralGCM-ENS的集合預報與ECMWF-ENS一樣,具有約為1的離散度-技巧比,這是校準預報的必要條件。
除了在天氣預測方面表現出色外,NeuralGCM在氣候模擬方面也展現出強大的能力,包括季節循環模擬、熱帶氣旋模擬和歷史溫度趨勢模擬。例如:
季節循環模擬:
- 準確性:NeuralGCM能夠準確模擬季節循環,包括全球可降水量和全球總動能的年循環,以及哈德利環流和緯向平均風等關鍵大氣動力學。
- 與全球雲解析模型的比較:與全球雲解析模型X-SHiELD相比,NeuralGCM在可降水量方面的偏差較小,在熱帶地區的溫度偏差較低。
熱帶氣旋模擬:
- 軌跡和數量:即使在1.4°的粗分辨率下,NeuralGCM也能產生與ERA5相似的熱帶氣旋軌跡和數量,而全球雲解析模型X-SHiELD在1.4°分辨率下低估了熱帶氣旋的數量。
歷史溫度趨勢模擬:
- AMIP模擬:NeuralGCM-2.8°進行了40年的AMIP模擬。結果顯示,所有模擬都準確捕捉到ERA5數據中觀察到的全球變暖趨勢,年際溫度趨勢與ERA5數據具有強相關性,表明NeuralGCM能夠有效模擬海溫強迫對氣候的影響。
- 與CMIP6模型的比較:與CMIP6 AMIP模型相比,NeuralGCM-2.8°在1981-2014年期間的溫度偏差較小,即使在去除CMIP6 AMIP模型的全球溫度偏差後也是如此。
儘管NeuralGCM在天氣和氣候預測方面展現出強大的能力,但它仍然存在一些限制:
-
預測未來氣候的能力有限:NeuralGCM目前無法預測與歷史氣候顯著不同的未來氣候。當海表溫度(SST)顯著增加(例如+4K)時,NeuralGCM的反應與預期不一致,並出現氣候漂移。
-
模擬未觀測氣候的能力不足:與其他機器學習氣候模型一樣,NeuralGCM在模擬未觀測的氣候方面也面臨挑戰,如未來氣候或與歷史數據顯著不同的氣候。這需要模型具有更強的泛化能力和更先進的訓練策略,如對抗訓練或元學習。
-
物理約束和數值穩定性問題:例如,NeuralGCM的譜分佈仍比ECMWF物理預報更模糊,在模擬極端天氣事件時仍存在一些數值穩定性問題。