[Édito] Corrélation, causalité et troisième variable
Toute chose commence par un choix
Lundi dernier, Vincent expliquait que les smartphones nous espionnent bel et bien, mais pas comme vous le pensez. C’est important de faire la distinction entre corrélation et causalité (le premier n’implique pas le second) et de réfléchir à une troisième variable qui pourrait être plus ou moins cachée.
Le 21 octobre 2024 à 17h53
8 min
Société numérique
Société
Cause -> effet
On commence par deux définitions issues du Larousse. La corrélation, pour commencer, est une « relation existant entre deux notions dont l'une ne peut être pensée sans l'autre, entre deux faits liés par une dépendance nécessaire ».
Quant à la causalité, c’est le « lien qui unit la cause à l'effet », toujours selon dictionnaire en ligne. Dans le film Matrix, le Mérovingien donne un exemple basique de la causalité : « Nous sommes tous victimes de la causalité : chaque fois que je bois trop de vin, il faut que je pisse ! Cause et effet ». Sa femme Perséphone lui donne un autre exemple de causalité peu après.
Passons directement à une locution latine qui résume parfaitement le propos de notre édito du jour : « cum hoc sed non propter hoc signifiant », que l’on peut traduire par « avec ceci, cependant pas à cause de ceci ».
Une manière de dire que corrélation n'implique pas causalité. Il s’agit, comme le rappelle Wikipédia, d’un « raisonnement fallacieux consistant à penser ou prétendre que la corrélation de deux événements impliquerait un lien de causalité entre ceux-ci ». On parle aussi d’effet cigogne.
De belles corrélations, sans aucune causalité
Sur Internet, on trouve des sites qui s’amusent avec ces notions, notamment Spurious correlations et un article du Monde proposé par Bansan dans les commentaires du LIDD. L’idée est la même dans les deux cas : trouver des données qui semblent être des corrélations entre deux événements, mais sans aucune causalité entre les deux.
Il reste 76% de l'article à découvrir.
Déjà abonné ? Se connecter
Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.
Accédez en illimité aux articles
Profitez d'un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
[Édito] Corrélation, causalité et troisième variable
-
Cause -> effet
-
De belles corrélations, sans aucune causalité
-
Parfois, la causalité est « cachée »
-
Corrélation entre fautes d'orthographe et taille des pieds
-
Immigration, délinquance et troisième(s) variable(s)
-
Corrélation entre publicités et centres d’intérêt
Commentaires (14)
Le 21/10/2024 à 19h29
Le 22/10/2024 à 21h37
Le 22/10/2024 à 00h47
Bref, une déconstruction qui n'en est pas une.
Le 22/10/2024 à 14h48
Ou alors j'ai rien pompé moi non plus.
Le 22/10/2024 à 01h18
Modifié le 22/10/2024 à 09h48
Ceci complique significativement la recherche de vraies corrélations entre séries temporelles.
Pour ceux que ça intéresserait, un petit lien vers le premier article mathématique sur le sujet (Yule, 1926), toujours une référence aujourd'hui.
Le 22/10/2024 à 07h46
Modifié le 22/10/2024 à 09h51
Le 23/10/2024 à 17h15
Le 23/10/2024 à 20h16
- Le mensonge par action ;
- Le mensonge par omission ;
- Les statistiques.
Modifié le 24/10/2024 à 11h11
"On commence par deux définitions issues du Larousse. La corrélation, pour commencer, est une « relation existant entre deux notions dont l'une ne peut être pensée sans l'autre, entre deux faits liés par une dépendance nécessaire »."
C'est bizarre, mais du coup cette définition ne semble pas correspondre aux corrélations qu'on cite par la suite. Je comprends que le but de l'article est d'expliquer que corrélation n'est pas causalité. Mais justement, même les corrélations citées par après montrent bien que non seulement les choses qu'on corrèle n'ont aucun lien de causalité (normal), mais en plus elles n'ont carrément aucun rapport entre elles. D'où l'absurdité de les rassembler. Elles n'ont pas cette caractéristique de "ne pas pouvoir être pensée l'une sans l'autre" (c'est même l'inverse) et ne représentent pas "deux faits liés par une dépendance nécessaire".
Ah, je viens d'aller voir moi-même la définition. Ou plutôt les définitions. Et en effet, la définition "générique" de corrélation est très différente de celle utilisée en statistique. Il serait peut-être plus pertinent de citer la définition "statistique" dans l'article ?
Le 24/10/2024 à 13h20
Au du dictionnaire de l'Académie française :
Le 24/10/2024 à 14h48
"Statistique
4. Liaison entre deux caractères (corrélation simple) ou plus (corrélation multiple) telle que les variations de leurs valeurs soient toujours de même sens (corrélation positive) ou de sens opposé (corrélation négative)."
Modifié le 25/10/2024 à 16h58
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?