Rechercher
Fermer ce champ de recherche.

☆ Qu’est-ce qu’une variable de contrôle dans une régression ?

Il est coutume courante d’entendre parler de “variables de contrôle” dans les modèles économétriques. De même on entend souvent dire qu’un résultat est critiquable dans la mesure où le modèle spécifié n’inclut pas suffisamment de variables de contrôle. De quoi parle-t-on ?

 

Ces variables de contrôle sont tout simplement des variables qui sont ajoutées par l’économiste dans une régression dans le but d’éviter un biais dans l’estimation du paramètre d’intérêt. Autrement dit, si vous vous intéressez à l’effet du taux de change euro/dollars sur la croissance économique en France, faire une régression avec simplement le taux de change euro/dollars en variable explicative (x) et la croissance économique en variable expliquée (y) a beaucoup de chance de s’avérer fallacieux: le paramètre reliant les deux variables ne sera pas mesuré correctement car d’autres variables expliquant la croissance économique ne sont pas spécifiées dans la régression. Les spécifier (on dit aussi « contrôler par d’autres variables ») permettra d’éviter un biais dans l’estimation du paramètre d’intérêt, celui reliant la croissance au taux de change.

Expliquons de manière plus mathématique: lorsqu’une variable capable d’expliquer la variable dépendante n’est pas spécifiée dans le modèle, celle-ci se retrouve de fait dans les résidus de la régression (toute l’information qui permet d’expliquer y qui n’est pas dans les x). Si cette variable est corrélée aux variables explicatives spécifiées dans le modèle, l’hypothèse de non corrélation entre les variables explicatives et les résidus, hypothèse nécessaire à la bonne estimation du modèle par moindre carrés ordinaires, ne sera pas respectée. On aura alors un biais dans l’estimation des coefficients concernés.

On voit donc l’importance de spécifier d’emblée toutes les variables x pertinentes pour expliquer une variable y, même si seul l’effet d’une variable x nous intéresse[1].

 

 

 


[1] Pour les plus avancés en économétrie, notons que le théorème de Frisch-Waugh permet de comprendre directement l’intérêt et la pertinence conditionnelle (i.e. conditionnelle à une éventuelle corrélation avec les explicatives) de l’inclusion de variables de contrôle. En effet ce théorème démontre que le coefficient reliant l’une des variables explicatives à la variable expliquée sera forcément biaisé si les autres variables significatives ne sont pas incluses dans la régression. Ce qui montre l’intérêt d’inclure un nombre suffisant de variables explicatives dans une régression.

 

 

Julien Pinter