Utiliser le deep learning pour prévoir les vagues de chaleur extrêmes ?

Utiliser le deep learning pour prévoir les vagues de chaleur extrêmes ?

Nero burning prediction

Avatar de l'auteur

Martin Clavey

Publié dansSociété numérique

14/04/2023
9
Utiliser le deep learning pour prévoir les vagues de chaleur extrêmes ?

Avec le changement climatique en cours, le nombre de canicules risque d'augmenter et d'avoir des conséquences sur notre environnement, nos pratiques quotidiennes, nos vies. La prévision de ces événements pourrait nous aider à nous adapter. La recherche en informatique essaie de rendre plus efficace cette prévision, en intégrant l'utilisation du deep learning avec celle des modèles météorologiques et climatiques.

Pour la prévision d'événements climatiques, Météo France et les autres services de météorologie mondiaux utilisent des modèles météorologiques et climatiques qui demandent un temps de calcul considérable. Météo France se sert actuellement de deux supercalculateurs parmi les 100 plus puissants : Taranis et Belenos.

Malgré ça, les vagues de chaleur extrêmes restent difficiles à anticiper et cette prévision demande des temps de calculs importants. Des chercheurs du CNRS essayent de réduire ce temps en utilisant le deep learning tout en s'appuyant, évidemment, sur des données venant des modèles de météorologie et de climat comme les cartes de pression, de températures, l'humidité du sol, l'état de l'océan et autres.

Comme nous vous l'avions annoncé la semaine dernière brièvement, ils ont publié dans la revue scientifique Physical Review Fluids [PDF] l'état de l'avancée de leurs travaux permettant d'avoir des prévisions précises 15 jours avant une canicule et jusqu'à un mois.

Simulation de 8 000 années climatiques

Heureusement, les vagues de chaleur extrêmes sont encore rares. Mais cette rareté entraine un manque de données pour faire tourner un algorithme de deep learning (réseau de neurones) qui serait capable d'apprendre quand l'une d'entre elles peut arriver. Les chercheurs du CNRS ont eu l'idée d'utiliser un simulateur climatologique, PlaSim, créé par des chercheurs de l'université de Hambourg pour créer des données de 8 000 années climatiques. 

Ils ont choisi ce simulateur, car il comporte une partie concernant la dynamique des fluides très réaliste, « similaire aux modèles climatiques utilisés pour les expériences CMIP décrites dans les rapports du GIEC », expliquent les chercheurs dans leur article. Mais contrairement à ces expériences, les paramétrages physiques sont plus simples, ce qui « permet de réduire considérablement le temps de calcul de PlaSim d'un facteur 100 ».

Choix des données pertinentes

L'idée de ces chercheurs est aussi de proposer un système de prévision par apprentissage automatique probabiliste, c'est-à-dire que l'algorithme donne une probabilité qu'une vague de chaleur extrême arrive. Mais au lieu d'utiliser énormément de données environnementales et de calculer à chaque fois la probabilité d'un événement extrême avec un supercalculateur, le modèle, une fois entraîné, pourrait être utilisé par un ordinateur portable et fournirait une prédiction en quelques secondes.

Concernant les données utilisées, dans leurs conclusions, les chercheurs expliquent que « la hauteur du géopotentiel à 500 hPa combinée à l'humidité du sol contiennent les informations les plus utiles à court terme ». La hauteur du géopotentiel est l'altitude à laquelle on atteint un potentiel égal de gravité, il varie selon la pression au niveau de la mer et la température moyenne entre le sol et l'altitude à laquelle on atteint une certaine pression, ici 500 hPa. Ce potentiel est utilisé en météorologie pour connaître le niveau de pression constante selon le lieu.

« La capacité de prévision associée à la hauteur du géopotentiel à 500 hPa décroît de façon approximativement exponentielle avec un temps de décroissance d'environ 7 jours » constatent-ils, « l'humidité du sol contient des informations complémentaires très importantes, avec une capacité de plateau qui ne décroît pas beaucoup sur des échelles de temps de l'ordre de 15 jours à un mois ».

En revanche, utiliser les données concernant l'hémisphère sud pour prévoir des canicules en France et en Europe est inutile, constatent-ils.

Combiner différentes approches

Si le système de ces chercheurs arrive à prédire des canicules dans ce système de simulation, ça ne veut pas dire, malheureusement, qu'il peut le faire pour l'été prochain. En travaillant sur des données simulées, les chercheurs, ici, ont voulu augmenter les données sur lesquelles ils pouvaient travailler pour que leurs résultats soient statistiquement significatifs. Mais, ils l'avouent eux-mêmes, les données modélisées ont plus de biais que celles venant des observations réelles. Ils plaident donc pour combiner les deux approches.

Les auteurs de l'article scientifique évoquent la technique du Transfert learning pour effectuer cette combinaison. Celle-ci consiste à profiter d'un premier entrainement d'un réseau de neurones sur un nombre important de données pour ensuite l'affiner en l'entrainant avec des données qui correspondent plus aux problèmes qu'on veut résoudre mais qu'on a en moins grande quantité. Mais les chercheurs ont des doutes sur le fait que cette approche soit suffisante avec des données aussi rares que celles à disposition sur les vagues de chaleur extrêmes.

Leur idée actuelle est plutôt d'améliorer les simulations de canicules pour rapprocher les données de simulations des données réelles. Ils ont déjà créé plusieurs modèles de simulation qu'ils vont pouvoir combiner avec le deep learning pour avoir de meilleurs résultats.

Si le deep learning amène des informations scientifiques intéressantes sur les canicules, il est « très probable que les systèmes météorologiques resteront la référence pour les prévisions à moyen terme en temps réel, tandis que le modèle statistique pourra être utilisé pour des études de processus, des simulations d'événements rares, des analyses statistiques ou des prévisions bon marché pour un champ d'application ciblé, ou éventuellement des prévisions sous-saisonnières ou saisonnières ».

9
Avatar de l'auteur

Écrit par Martin Clavey

Tiens, en parlant de ça :

Carte graphique AMD GeForce

Cartes graphiques : 30 ans d’évolution des GPU

Ha… la bonne époque d’un CF de 4870 X2 !

18:10 Hard 13

Google lance son opération de communications Gemini pour rivaliser avec OpenAI

Preprint not PR-print

17:31 IA 6
Ecran bleu de Windows

Linux : le composant systemd se dote d’un écran bleu de la mort

LoL Micro$oft

16:33 Soft 29

Sommaire de l'article

Introduction

Simulation de 8 000 années climatiques

Choix des données pertinentes

Combiner différentes approches

Carte graphique AMD GeForce

Cartes graphiques : 30 ans d’évolution des GPU

Hard 13

Google lance son opération de communications Gemini pour rivaliser avec OpenAI

IA 6
Ecran bleu de Windows

Linux : le composant systemd se dote d’un écran bleu de la mort

Soft 29
Une petite fille en train d'apprendre à programmer et hacker logiciels et appareils électroniques

Un roman graphique explique les logiciels libres aux enfants

SoftSociété 17
Nouveautés pour Messenger

Meta lance (enfin) le chiffrement de bout en bout de Messenger, entre autres

Socials 5

#LeBrief : cloud européen, OSIRIS-REx a frôlée la catastrophe, CPU AMD Ryzen 8040

Windows en 2024 : beaucoup d’IA, mais pas forcément un « 12 »

Soft 19
Einstein avec des qubits en arrière plan

Informatique quantique, qubits : avez-vous les bases ?

HardScience 9
Notifications iPhone

Surveillance des notifications : un sénateur américain demande la fin du secret

DroitSécu 17

En ligne, les promos foireuses restent d’actualité

DroitWeb 19

#LeBrief : modalité des amendes RGPD, cyberattaque agricole, hallucinations d’Amazon Q, 25 ans d’ISS

Logo Twitch

Citant des « coûts prohibitifs », Twitch quitte la Corée du Sud

ÉcoWeb 29
Formation aux cryptomonnaies par Binance à Pôle Emploi

Binance fait son marketing pendant des formations sur la blockchain destinées aux chômeurs

Éco 10
Consommation électrique du CERN

L’empreinte écologique CERN en 2022 : 1 215 GWh, 184 173 teqCO₂, 3 234 Ml…

Science 6
station électrique pour voitures

Voitures électriques : dans la jungle, terrible jungle, des bornes de recharge publiques

Société 75

#LeBrief : intelligence artificielle à tous les étages, fichier biométrique EURODAC

KDE Plasma 6

KDE Plasma 6 a sa première bêta, le tour des nouveautés

Soft 13
Un homme noir regarde la caméra. Sur son visage, des traits blancs suggèrent un traitement algorithmique.

AI Act et reconnaissance faciale : la France interpelée par 45 eurodéputés

DroitSociété 4
Api

La CNIL préconise l’utilisation des API pour le partage de données personnelles entre organismes

SécuSociété 3
Fouet de l’Arcep avec de la fibre

Orange sanctionnée sur la fibre : l’argumentaire de l’opérateur démonté par l’Arcep

DroitWeb 23
Bombes

Israël – Hamas : comment l’IA intensifie les attaques contre Gaza

IA 22

#LeBrief : bande-annonce GTA VI, guerre électronique, Spotify licencie massivement

Poing Dev

Le poing Dev – Round 7

Next 102
Logo de Gaia-X sour la forme d’un arbre, avec la légende : infrastructure de données en forme de réseau

Gaia-X « vit toujours » et « arrive à des étapes très concrètes »

WebSécu 6

Trois consoles portables en quelques semaines

Hard 37
Une tasse estampillée "Keep calm and carry on teaching"

Cyberrésilience : les compromis (provisoires) du trilogue européen

DroitSécu 3

#LeBrief : fuite de tests ADN 23andMe, le milliard pour Android Messages, il y a 30 ans Hubble voyait clair

next n'a pas de brief le week-end

Le Brief ne travaille pas le week-end.
C'est dur, mais c'est comme ça.
Allez donc dans une forêt lointaine,
Éloignez-vous de ce clavier pour une fois !

Commentaires (9)


barlav Abonné
Le 14/04/2023 à 07h43

“En revanche, utiliser les données concernant l’hémisphère sud pour prévoir des canicules en France et en Europe est inutile, constatent-ils.”
:oui2:
Hmmm, ils ont oublié Coriolis, ça tourne à l’envers les cyclones là-bas.
:fume:


misocard Abonné
Le 14/04/2023 à 08h16

Merci :)



J’avais du mal à lire le papier :s


carbier Abonné
Le 14/04/2023 à 09h10

Un résumé précis, les limites de l’exercice clairement exprimées: merci :yes:


jpaul Abonné
Le 14/04/2023 à 12h59

Ah bah d’après les dernières années, j’avais l’impression que l’algo c’était





if(true) {
canicule = true;
}




mfaure Abonné
Le 15/04/2023 à 06h06

Merci @martin clavey, c’est passionnant !


trytodosth Abonné
Le 15/04/2023 à 17h13

Par le l’article scientifique en question mais très clair le résumé Matin, merci !


fofo9012 Abonné
Le 16/04/2023 à 08h57

Très intéressant, c’est vrai qu’on manque encore pas mal de recul, en 2003 c’était exceptionnel, en 2023 c’est quasi tous les ans !
Si j’ai bien compris, l’objet de la recherche et de prédire à court terme avec des données de météorologies (pression…)



Pour qu’il y’ait un intérêt il faudrait pouvoir prévoir à 6mois, pour que dès l’hiver on puisse anticiper les prb à venir d’eau ou de surconsommation de clims. Du coup j’ai l’impression qu’on est plus dans le climat que la météo.


Seb35w Abonné
Le 16/04/2023 à 13h05

J’ai un peu de mal à croire à cette approche si utilisée seule (utiliser le passé pour prédire l’avenir sachant que le changement climatique a des effets inédits), mais pourquoi pas l’utiliser en donnée d’entrée d’un scénario à approfondir via un modèle classique et plus complet sur l’étendue des paramètres pris en compte.


FrancoisA Abonné
Le 16/04/2023 à 15h51

Et pourquoi se limiter à prévoir l’avenir du climat 6 mois plus tard ?
On pourrait prédire la canicule de 2035 par exemple (à plus ou moins un jour près, faut pas être trop exigeant non plus).