[Édito] Corrélation, causalité et troisième variable

Toute chose commence par un choix

[Édito] Corrélation, causalité et troisième variable

Lundi dernier, Vincent expliquait que les smartphones nous espionnent bel et bien, mais pas comme vous le pensez. C’est important de faire la distinction entre corrélation et causalité (le premier n’implique pas le second) et de réfléchir à une troisième variable qui pourrait être plus ou moins cachée.

Le 21 octobre 2024 à 17h53

Commentaires (14)

votre avatar
Celle-ci a particulièrement inspiré Flock pour l’illustration de notre édito !
Merci pour l'explication, parce que je ne comprenais pas bien le lien.
votre avatar
C'est pas plutôt le visuel de l'album de Nirvana Nervermind 😂
votre avatar
Attention, le raisonnement sur la délinquance est à la limite du fallacieux. Certes, l'immigration en rend pas les gens délinquants, mais votre explication dit textuellement que la population immigrée contient par nature une plus grande proportion de profils susceptibles d'être délinquants (jeunes hommes pauvres), donc in fine ça établit quand même bien un lien entre délinquance et immigration.
Bref, une déconstruction qui n'en est pas une.
votre avatar
Statistiquement, ce n'est pas faux mais l'idée était de montrer les variables cachées : jeune homme pauvre, surtout pauvre d'ailleurs. Lien il y a mais pas du fait qu'il y aurait des gens qui, venant d'où ils viennent, seraient foncièrement délinquants, lien via les variables cachées, c'est le sujet justement.
Ou alors j'ai rien pompé moi non plus.
votre avatar
Réduire la surveillance des téléphones dit intelligents au traçage publicitaire, c'est surprenant, décevant, et… inquiétant ?
votre avatar
Il est très facile d'obtenir une fausse corrélation entre deux séries temporelles. Il suffit qu' elles aient toutes deux une tendance ( elles montent ou descendent au cours du temps) pour n'importe quelle raison et boum, les voilà corrélées...
Ceci complique significativement la recherche de vraies corrélations entre séries temporelles.
Pour ceux que ça intéresserait, un petit lien vers le premier article mathématique sur le sujet (Yule, 1926), toujours une référence aujourd'hui.
votre avatar
Aaaaah la corrélation entre les films de Nicholas Cage et les noyades, merci Flock <3
votre avatar
Passons directement à une locution latine ... « cum hoc sed non propter hoc signifiant »
Roi Loth sort de ce corps. :mdr: Mundi placet spiritus minima
votre avatar
Si j'achète de plus grandes chaussures, commettrai-je moins de fautes d'orthographe ?
votre avatar
Il faut garder en mémoire ses fondamentaux : Il existe trois formes de mensonge:
- Le mensonge par action ;
- Le mensonge par omission ;
- Les statistiques.
votre avatar
Ha ha, cette illustration! Excellente. Même si elle fait un peu peur, j'avoue.

"On commence par deux définitions issues du Larousse. La corrélation, pour commencer, est une « relation existant entre deux notions dont l'une ne peut être pensée sans l'autre, entre deux faits liés par une dépendance nécessaire »."

C'est bizarre, mais du coup cette définition ne semble pas correspondre aux corrélations qu'on cite par la suite. Je comprends que le but de l'article est d'expliquer que corrélation n'est pas causalité. Mais justement, même les corrélations citées par après montrent bien que non seulement les choses qu'on corrèle n'ont aucun lien de causalité (normal), mais en plus elles n'ont carrément aucun rapport entre elles. D'où l'absurdité de les rassembler. Elles n'ont pas cette caractéristique de "ne pas pouvoir être pensée l'une sans l'autre" (c'est même l'inverse) et ne représentent pas "deux faits liés par une dépendance nécessaire".

Ah, je viens d'aller voir moi-même la définition. Ou plutôt les définitions. Et en effet, la définition "générique" de corrélation est très différente de celle utilisée en statistique. Il serait peut-être plus pertinent de citer la définition "statistique" dans l'article ?
votre avatar
Je préfère la définition du wiktionnaire :
2. (Mathématiques) Mesure de la relation statistique entre deux variables.
Au du dictionnaire de l'Académie française :
(Sciences) Rapport de deux ou plusieurs faits dont les variations paraissent concomitantes.
votre avatar
En fait, dans le Larousse, d'où vient la définition principale/générique citée dans l'article, il y a 3 autres définitions qui s'appliquent à des domaines plus spécifiques, dont celle-ci qui elle correspond bien à ce qui est expliqué dans l'article (l'utilisation en statistique) :

"Statistique

4. Liaison entre deux caractères (corrélation simple) ou plus (corrélation multiple) telle que les variations de leurs valeurs soient toujours de même sens (corrélation positive) ou de sens opposé (corrélation négative)."
votre avatar
"On commence par deux définitions issues du Larousse. La corrélation, pour commencer, est une « relation existant entre deux notions dont l'une ne peut être pensée sans l'autre, entre deux faits liés par une dépendance nécessaire »." C'est bizarre, mais du coup cette définition ne semble pas correspondre aux corrélations qu'on cite par la suite.
Effectivement, je l'ai signalé dès la sortie de l'article...

[Édito] Corrélation, causalité et troisième variable

  • Cause -> effet

  • De belles corrélations, sans aucune causalité

  • Parfois, la causalité est « cachée »

  • Corrélation entre fautes d'orthographe et taille des pieds

  • Immigration, délinquance et troisième(s) variable(s)

  • Corrélation entre publicités et centres d’intérêt

Fermer