Fiche méthode - Corrélation et causalité

Catégorie parente: Fiches-méthodes
Catégorie : Méthode des sciences sociales
Mis à jour le jeudi 22 décembre 2016 08:38
Publié le mardi 28 février 2012 13:42

Pour argumenter, il est très souvent utile de s’appuyer sur l’existence de liens statistiques entre deux phénomènes, soit pour confirmer une théorie, soit pour la contredire ou la nuancer. Mais comment rendre compte de l’existence (ou non) d’un lien statistique ? Tout lien statistique est-il synonyme de causalité ? A l’inverse, lorsqu’il existe une causalité, y a-t-il toujours corrélation ?

 

1. Quels sont les types de liens?

On peut distinguer 3 situations lorsque l’on observe l’intensité du lien statistique entre deux variables :


Exemples (données fictives)


3 situations possibles

Relation entre la taille et le poids d’un individu

Taille

1m70

1m75

1m80

1m85

Poids

74 kg

79 kg

83 kg

88 kg

une corrélation positive

les deux variables varient dans le même sens (lorsqu’une variable augmente, l’autre augmente également ; ou lorsqu’une variable diminue, l’autre diminue également)

 

Relation entre le nombre de cigarettes fumées par jour et l’espérance de vie

Nombre de Cigarettes / jour

0

10

20

30

Espérance de vie

90 ans

80 ans

70 ans

60 ans

une corrélation négative

les deux variables varient en sens inverse (lorsqu’une variable augmente, l’autre diminue)

Relation entre la taille d’un individu et son espérance de vie

Taille

1m70

1m75

1m80

1m85

Espérance de vie

85 ans

85 ans

85 ans

85 ans

Relation entre la vitesse maximale du vent à Brest et le nombre d’éléphants tués au Kénya

Vitesse du vent (km/H)

90

100

110

120

130

Nombre d’éléphants tués au Kénya

150

80

170

90

120

Une absence de corrélation

lorsqu’une variable varie, l’autre ne varie pas, ou alors varie sans lien avec la première.


A savoir : une représentation graphique permet souvent de mieux repérer s'il y a corrélation ou non:
- il y a corrélation si les points sont relativement bien alignés sur une droite (dont la pente donne alors le sens de la corrélation)
- il y a absence de corrélation si les points sont particulièrement dispersés

 

Exemple 1 : Une corrélation positive

source : Statistique Canada

Exemple 2 : Une quasi absence de corrélation


source : "Le rmi : d'un transfert de gestion à une décentralisation de responsabilité", Sénat, Rapport d'information n° 316 (2004-2005) de M. Michel MERCIER, fait au nom de l'observatoire de la décentralisation, déposé le 4 mai 2005



2. Un lien statistique exprime-t-il toujours une causalité ?

La causalité est la relation de la cause à l’effet qu’elle produit. Si un lien statistique peut être le signe d'une causalité, ce n'est pas toujours le cas.


Un lien statistique peut être le signe d'une causalité


Quelle est la cause, quel est l’effet ?


Imaginons que l’on observe un lien statistique entre la quantité de pluie au printemps et la hauteur des herbes sauvages. SI l’on envisage l’existence d’une causalité, il faut se demander quelle est la cause et quel est l’effet. Ici, la cause est plus vraisemblablement la quantité de pluie (sauf à penser que des herbes hautes puissent transpercer des nuages et faire tomber la pluie…)


Causalité réciproque


Imaginons que l’on observe un lien statistique entre le niveau d’éducation d’une population d’un pays et la richesse de ce propre pays. Si l’on envisage l’existence d’une causalité, quelle est la cause et quel est l’effet ? On peut penser que plus un pays possède une population éduquée, plus les salariés seront qualifiés et efficaces, et plus le pays sera riche. Mais la réciproque est également envisageable : plus un pays est riche, et plus il peut consacrer de ressources à l’éducation de sa population. Il y a alors une double causalité.


Un lien statistique n’est pas toujours le signe d'une causalité


le lien statistique peut-être l’effet du hasard


La taille moyenne des japonais a augmenté de 15 cm depuis la fin de la 2ème guerre mondiale alors que la distance entre le Japon et les Etats-Unis augmente de 2 ou 3 cm par an à cause de la dérive des continents. Il y a corrélation, mais il n’y a bien évidemment pas causalité.


le lien statistique peut-être dû à une variable explicative cachée, influençant simultanément les deux autres variables


Une étude statistique a montré un lien positif entre l’utilisation de crème solaire et le risque de cancer de la peau. Des journalistes pressés en avaient conclu un peu vite à la nocivité de la crème solaire alors que "utilisation de crème solaire" et "cancer de la peau" n’étaient que la conséquence d’une même cause : l’exposition au soleil (la variable explicative cachée)

3. S’il y a causalité, y a-t-il toujours corrélation ?

Il est possible qu’il existe une causalité entre deux phénomènes, sans que l’on repère de lien statistique. Par exemple, le niveau d’éducation d’un pays influence sa richesse, mais si, dans le même temps ce pays connaît une guerre, son niveau de richesse va diminuer, malgré le niveau élevé d’éducation.

De manière plus générale, lorsqu’un effet (B) a plusieurs causes (A1, A2, A3…), il est possible que l’on n’observe pas de lien statistique entre l’effet et une de ses causes prise isolément.

 

Quelques articles pour distinguer corrélation et causalité :