Les données de l'Organisation météorologique mondiale (OMM) montrent qu'au cours des 50 dernières années, en moyenne, une catastrophe liée aux conditions météorologiques, au climat ou à l'eau s'est produite chaque jour, causant environ 115 décès et 202 millions de dollars de pertes économiques par événement.
Plus alarmant encore, ces dernières années, le changement climatique accéléré par les activités humaines a entraîné une augmentation anormale des catastrophes météorologiques et climatiques extrêmes telles que les vagues de chaleur, les vagues de froid, les précipitations intenses et les sécheresses.
Par conséquent, des prévisions météorologiques et des simulations climatiques précises et opportunes peuvent non seulement aider à sauver des dizaines de milliers de vies chaque année, mais aussi réduire l'impact catastrophique des événements météorologiques et climatiques extrêmes sur la société humaine et les écosystèmes.
Aujourd'hui, un modèle d'intelligence artificielle (IA) appelé NeuralGCM, développé par l'équipe de recherche de Google et ses collaborateurs, a porté les prévisions météorologiques et les simulations climatiques à un nouveau niveau :
- La précision de NeuralGCM pour les prévisions de 1 à 15 jours est comparable à celle du Centre européen pour les prévisions météorologiques à moyen terme (CEPMMT), qui possède le modèle physique traditionnel de prévision météorologique le plus avancé au monde.
- Pour les prévisions à 10 jours, NeuralGCM fonctionne aussi bien ou mieux que les modèles d'IA existants.
- Avec l'inclusion de la température de surface de la mer, les résultats de prévision climatique sur 40 ans de NeuralGCM sont cohérents avec les tendances du réchauffement climatique trouvées dans les données du CEPMMT.
- NeuralGCM surpasse également les modèles climatiques existants dans la prédiction des cyclones et de leurs trajectoires.
Notamment, NeuralGCM non seulement égale ou dépasse la précision des modèles traditionnels de prévision numérique du temps existants et d'autres modèles d'apprentissage automatique (ML), mais il est également significativement plus rapide, capable de générer 22,8 jours de simulation atmosphérique en 30 secondes de temps de calcul. Il peut également économiser des ordres de grandeur en ressources de calcul par rapport aux modèles traditionnels.
L'article de recherche associé, intitulé "Neural general circulation models for weather and climate", a été publié dans la revue scientifique de référence Nature.
Ces résultats démontrent collectivement que NeuralGCM peut générer des prévisions déterministes du temps, des ensembles de prévisions météorologiques et climatiques, montrant une stabilité suffisante pour des simulations météorologiques et climatiques à long terme.
L'équipe de recherche estime que cette approche d'apprentissage profond de bout en bout est compatible avec les tâches effectuées par les modèles de circulation générale traditionnels (GCM, qui représentent les processus physiques dans l'atmosphère, les océans et les terres, et sont la base des prévisions météorologiques et climatiques), et peut améliorer les simulations physiques à grande échelle qui sont cruciales pour comprendre et prédire le système terrestre.
De plus, l'approche de modélisation hybride de NeuralGCM peut être appliquée à d'autres domaines scientifiques, tels que la découverte de matériaux, le repliement des protéines et la conception technique multi-physique.
Réduire l'incertitude dans les prévisions à long terme et estimer les événements météorologiques extrêmes sont essentiels pour comprendre l'atténuation et l'adaptation au changement climatique.
Les modèles ML sont depuis longtemps considérés comme un moyen alternatif de prévision météorologique, avec l'avantage d'économiser des coûts de calcul. Ils ont même atteint ou dépassé le niveau des modèles de circulation atmosphérique dans les prévisions météorologiques déterministes. Cependant, ils sont souvent moins performants que les modèles de circulation atmosphérique dans les prévisions à long terme.
Dans ce travail, l'équipe de recherche a conçu NeuralGCM en combinant des méthodes d'apprentissage automatique et physiques, en utilisant des composants ML pour remplacer ou corriger les schémas de paramétrisation physique traditionnels dans les GCM. Il se compose des parties clés suivantes :
-
Noyau dynamique différentiable : Ce noyau est responsable de la résolution des équations dynamiques discrétisées, simulant le mouvement des fluides à grande échelle et les processus thermodynamiques influencés par la gravité, la force de Coriolis et d'autres facteurs. Le noyau dynamique utilise une discrétisation pseudo-spectrale horizontale et des coordonnées sigma verticales, et est implémenté à l'aide de la bibliothèque JAX, prenant en charge la différentiation automatique. Il simule sept variables de prévision : la vorticité du vent horizontal, la divergence du vent horizontal, la température, la pression de surface, et trois substances aqueuses (humidité spécifique, contenu en eau des nuages de glace et contenu en eau des nuages liquides).
-
Module de physique d'apprentissage : Ce module utilise la méthode de colonne unique dans les GCM, n'utilisant que les informations d'une seule colonne atmosphérique pour prédire l'influence des processus non résolus dans cette colonne. Il utilise un réseau neuronal entièrement connecté avec des connexions résiduelles, partageant les poids à travers toutes les colonnes atmosphériques. Les entrées du réseau neuronal comprennent les variables de prévision dans la colonne atmosphérique, le rayonnement solaire incident total, la concentration de glace de mer et la température de surface de la mer, ainsi que les gradients horizontaux des variables de prévision. La sortie du réseau neuronal est la tendance des variables de prévision, mise à l'échelle par l'écart-type inconditionnel du champ cible.
-
Encodeur et décodeur : Étant donné que les données ERA5 sont stockées en coordonnées de pression tandis que le noyau dynamique utilise un système de coordonnées sigma, des encodeurs et des décodeurs sont nécessaires pour la conversion. Ces composants effectuent une interpolation linéaire entre les niveaux de pression et les niveaux de coordonnées sigma, et utilisent la même architecture de réseau neuronal que le module de physique appris pour la correction. L'encodeur peut éliminer les ondes de gravité causées par le choc d'initialisation, évitant ainsi la contamination des résultats de prédiction.
Les résultats montrent que NeuralGCM démontre de puissantes capacités en matière de prévision météorologique, comparables aux modèles de pointe à des échelles de temps ultra-courtes, courtes et moyennes. Par exemple :
Prévision à très court terme (0-1 jour) :
- Capacité de généralisation : Par rapport à GraphCast, NeuralGCM fonctionne mieux dans des conditions météorologiques non entraînées car il utilise des réseaux neuronaux locaux pour prédire les processus physiques dans les colonnes verticales atmosphériques.
Prévision à court terme (1-10 jours) :
- Précision : Dans les prévisions à court terme de 1 à 3 jours, NeuralGCM-0.7° et GraphCast sont les plus performants, suivant avec précision les changements dans les modèles météorologiques.
- Cohérence physique : Par rapport aux autres modèles d'apprentissage automatique, les prédictions de NeuralGCM sont plus claires, évitant les prédictions floues physiquement incohérentes.
- Interprétabilité : En diagnostiquant les précipitations moins l'évaporation, les résultats de NeuralGCM sont plus interprétables, facilitant l'analyse des ressources en eau.
- Équilibre du vent géostrophique : Par rapport à GraphCast, NeuralGCM simule plus précisément les vents géostrophiques et leur structure verticale et leurs rapports.
Prévision à moyen terme (7-15 jours) :
- Prévision d'ensemble : NeuralGCM-ENS à une résolution de 1,4° a des erreurs RMSE, RMSB et CRPS moyennes d'ensemble plus faibles que ECMWF-ENS, indiquant sa capacité à mieux capturer les états météorologiques moyens possibles.
- Calibrabilité : Les prévisions d'ensemble de NeuralGCM-ENS, comme ECMWF-ENS, ont un rapport dispersion-compétence d'environ 1, ce qui est une condition nécessaire pour des prévisions calibrées.
En plus d'excellentes performances en matière de prévision météorologique, NeuralGCM démontre également de fortes capacités en matière de simulation climatique, y compris la simulation du cycle saisonnier, la simulation des cyclones tropicaux et la simulation des tendances de température historiques. Par exemple :
Simulation du cycle saisonnier :
- Précision : NeuralGCM peut simuler avec précision les cycles saisonniers, y compris les cycles annuels de l'eau précipitable globale et de l'énergie cinétique totale globale, ainsi que les dynamiques atmosphériques clés telles que la circulation de Hadley et les vents moyens zonaux.
- Comparaison avec les modèles globaux de résolution des nuages : Par rapport au modèle global de résolution des nuages X-SHiELD, NeuralGCM présente des biais plus faibles dans l'eau précipitable et des biais de température plus faibles dans les régions tropicales.
Simulation des cyclones tropicaux :
- Trajectoires et nombres : Même à une résolution grossière de 1,4°, NeuralGCM peut produire des trajectoires et des nombres de cyclones tropicaux similaires à ERA5, tandis que le modèle global de résolution des nuages X-SHiELD sous-estime le nombre de cyclones tropicaux à une résolution de 1,4°.
Simulation des tendances de température historiques :
- Simulation AMIP : NeuralGCM-2.8° a effectué une simulation AMIP sur 40 ans. Les résultats montrent que toutes les simulations capturent avec précision la tendance au réchauffement global observée dans les données ERA5, et les tendances de température interannuelles ont une forte corrélation avec les données ERA5, indiquant que NeuralGCM peut efficacement simuler l'impact du forçage de la température de la mer sur le climat.
- Comparaison avec les modèles CMIP6 : Par rapport aux modèles CMIP6 AMIP, NeuralGCM-2.8° présente des biais de température plus faibles pendant la période 1981-2014, même après avoir supprimé le biais de température global des modèles CMIP6 AMIP.
Bien que NeuralGCM démontre de puissantes capacités en matière de prévision météorologique et climatique, il présente encore certaines limitations :
-
Capacité limitée à prédire le climat futur : NeuralGCM ne peut actuellement pas prédire les climats futurs qui sont significativement différents des climats historiques. Lorsque la température de surface de la mer (SST) augmente significativement (par exemple, +4K), la réponse de NeuralGCM est incohérente avec les attentes et une dérive climatique se produit.
-
Capacité insuffisante à simuler des climats non observés : Comme d'autres modèles climatiques d'apprentissage automatique, NeuralGCM fait également face à des défis pour simuler des climats non observés, tels que les climats futurs ou les climats qui diffèrent significativement des données historiques. Cela nécessite que les modèles aient des capacités de généralisation plus fortes et des stratégies d'entraînement plus avancées, telles que l'entraînement adversarial ou le méta-apprentissage.
-
Contraintes physiques et problèmes de stabilité numérique : Par exemple, la distribution spectrale de NeuralGCM est encore plus floue que les prévisions physiques du CEPMMT, et il existe encore certains problèmes de stabilité numérique dans la simulation d'événements météorologiques extrêmes.