Passer au document

Facteur de confusion, interactions et analyses multivariées

Cours de lecture critique d'article
Matière

Lecture critique d'article

27 Documents
Les étudiants ont partagé 27 documents dans ce cours
Année académique : 2021/2022
Partagé par:
Étudiant Anonyme
Ce document a été téléchargé par un étudiant, tout comme toi, qui a décidé de rester anonyme.
Université de Montpellier

Commentaires

Merci de s'identifier ou s’enregistrer pour poster des commentaires.

Aperçu du texte

Facteurs de confusion, interaction et analyses

multivariés

Table des matières

I – Biais de confusion.......................................................................................................... 1 – Définition................................................................................................................................ 2 – Exemple : Infection et décès.................................................................................................... 3 – Résultat et interprétation de l’ajustement...............................................................................

II – Interaction ou modification d’effet................................................................................ 1 – Suite des résultats et de l’interprétation de l’ajustement de l’exemple précèdent................... 2 – Définition de l’interaction.......................................................................................................

III – Neutralisation des facteurs de confusion...................................................................... 1 – Lors de la sélection des sujets.................................................................................................. 2 – Lors de l’analyse...................................................................................................................... 3 – Standardisation.....................................................................................................................

Objectif :  Définir ce qu’est un biais de confusion  Citer les principaux moyens de contrôle des biais de confusion aux différents temps d’une recherche clinique  Expliquer le principe d’une analyse stratifiée, d’un modèle multivarié et d’une standardisation dans la prise en compte de facteur de confusion  Identifier le modèle adapté à la nature de la variable d’intérêt et savoir en interpréter le résultat  Différencier un biais de confusion et une interaction (effet modulateur)

I – Biais de confusion

1 – Définition

Un facteur F joue le rôle de facteur de confusion dans la relation entre l’exposition E et la maladie M si dans la population cible :

  • F est lié à E
  • F est lié à M
  • F n’est pas une conséquence de E Un facteur n’est jamais un facteur de confusion en soit, tout seul mais c’est un facteur de confusion pour une relation particulière. La question du facteur de confusion ne se posera que si on étudie une association précise, en changeant d’association, les facteurs de confusion ne seront plus les mêmes.

L’exemple classique du biais de confusion est la prise en considération de la consommation d’alcool dans le lien entre tabagisme et cancer du poumon. En l’absence de prise en compte du tabagisme, on peut trouver une relation entre l’alcool et le cancer du poumon. On pourrait alors croire que l’alcool agit de façon causale sur le cancer du poumon, alors qu’il s’agit en réalité de l’effet du tabac. En effet, les gens qui boivent sont plus souvent fumeurs que le reste de la population. L’alcool ne cause pas le cancer du poumon, c’est le tabagisme chez les alcooliques qui cause le cancer du poumon. Ici, le tabagisme est lié à l’alcoolisme, et également au cancer du poumon, et n’est pas conséquence de l’alcoolisme, il s’agit donc d’un facteur de confusion.

2 – Exemple : Infection et décès

Le rôle propre, sans intervention des facteurs de confusion, de l’infection sur le décès est cherché à travers une étude comparant l’incidence de décès chez les personnes atteintes d’une infection et chez elles indemnes de cette infection. On trouve un OR égal à 5. Ne sachant pas si, dans la population cible, l’évènement observé, ici le décès, est rare (si les patients ont été inclus dans un service de réanimation, la prévalence du décès peut s’élever à 10%) on ne peut pas dire que l’infection multiplie par 5 le risque de décès. Mais cette association est forte donc si l’intervalle de confiance de l’OR ne comprenait pas la valeur 1, on pourrait conclure que cette association est significative, et ce même en l’absence de

3 – Résultat et interprétation de l’ajustement

A partir de notre exemple et sur le groupe des jeunes et des vieux, on va aller calculer 2 risques relatifs dans ces 2 strates (qui seront donc des risques relatifs stratifiés). Et comme les groupes sont homogènes sur l’âge, la relation entre l’exposition, l’infection et la maladie, le décès, sera indépendante de l’âge. Le risque relatif ajusté est grossièrement la moyenne entre ces 2 risques relatifs.

Remarque : En réalité, la formule statistique est un peu plus complexe qu’une simple moyenne car il faut, entre autres, pondérer avec les effectifs.

 Si le RR ajusté = 3 alors que le RR brut = 5 alors une partie de la relation entre l’infection et le décès est expliquée par l’âge. Ce qui revient à dire que : - l’infection n’est pas un facteur de risque. - l’âge est un facteur de confusion Une différence d’au moins 15 ou 20% entre le RR brut et le RR ajusté permet de dire que le changement de risque relatif est significatif et potentiellement expliqué par un bais de confusion. De plus, si l’intervalle de confiance ne contient pas la valeur 1 alors on montre qu’il y a deux facteurs de risque au décès : l’infection et l’âge.

 Si le RR ajusté = 1 alors toute l’association entre l’exposition et la maladie est expliqué par le facteur de confusion. - F est un facteur de confusion - E n’est pas un facteur de risque de M (décès) (IC95% contient 1) On peut dire que F est un facteur de confusion mais surtout l’exposition E n’est vraiment pas un facteur de risque puisque l’intervalle de confiance de son RR ajusté contient la valeur 1.

 Si RR ajusté = RR brut alors l’association entre l’exposition et la maladie n’est pas due au facteur de confusion. L’âge n’est pas dans cette situation un facteur de confusion. - F n’est pas facteur de confusion - E est facteur de risque de M (décès) (IC95% ne contient pas 1)

 Si le RR ajusté > RR brut alors une partie de la relation entre l’exposition et la maladie était masqué par le facteur de confusion. L’âge est aussi un facteur de confusion mais au lieu d’expliquer la relation, il la masque. - F est un facteur de confusion - E est un facteur de risque de M (décès) (si IC95% ne contient pas 1) Le facteur de confusion ne rapproche pas toujours la valeur du RR ajusté à 1. Il peut aussi augmenter sa valeur, il agit dans tous les sens.

Question : Pourquoi est-ce qu’on ne calcule pas uniquement le RR ajusté?

Selon l’objectif de l’article :

  • soit on recherche des nouveaux facteurs de risque dans un objectif purement physiopathologique et mécanistique, il arrive qu’on passe directement par le RR ajusté. On ne présentera que le RR ajusté sans présenter les résultats des facteurs de confusion éventuels mais en mentionnant juste qu’on les a pris en considération.

  • il arrive cependant que le RR brut ait un intérêt pour la santé publique parce qu’il peut être utilisé non seulement comme facteur explicatif , ce qui aura un intérêt pour les chercheurs fondamentaux pour expliquer les pathologies et trouver des nouvelles cibles thérapeutiques par exemple. Mais il peut aussi être utilisé comme marqueur de risque (ce qui est différent de facteur de risque). Le marqueur de risque permet d’identifier les patients à risque de la maladie peu importe si ce marqueur de risque est ou non une cause de la pathologie. Il permet de repérer les patients s’il est plus facile d’explorer ce marqueur que le facteur de risque. Un exemple un peu théorique est de considérer le tabac comme étant tabou, que sa consommation était très mal vue en société de sorte que les gens refusent de dire s’ils fument ou pas et qu’uniquement les fumeurs mangent des bonbons à la menthe. Il sera alors plus facile de demander si le patient mange des bonbons à la menthe que de l’interroger sur son tabagisme pour définir s’il faut le surveiller sur le plan cardio-vasculaire. On sera parfois amener à choisir la prise en charge non pas en fonction des facteurs de risque démontrés mais en sachant que la caractéristique observée chez le patient est un marqueur de risque. Le marqueur de risque peut aussi servir si le facteur de risque est trop compliqué à explorer.

  • le dernier intérêt a présenté le RR brut et le RR stratifié est de pouvoir démontrer que F est bien un facteur de confusion. Ce qui permettra dans des études ultérieures de prendre en compte ce facteur de confusion, si on avait un doute.

II – Interaction ou modification d’effet

1 – Suite des résultats et de l’interprétation de l’ajustement de

l’exemple précèdent

Si dans l’analyse stratifiée, dans nos 2 sous-groupes de sujets jeunes et âgées, dans le cadre de l’association infection - décès, on obtient 2 RR différents alors F est un facteur d’interaction (= facteur modificateur d’effet). Ainsi, il y a un facteur de l’infection sur le décès mais cet effet n’aura pas toujours un RR = 3 puisque sa valeur va se modifier en fonction de celle du facteur d’interaction. Par exemple, si le RR chez les jeunes = 1 et le RR chez les vieux = 7 avec un RR brut = 5 alors l’effet de l’infection sur le décès est différent selon l’âge. L’infection est alors un facteur de risque chez les sujets âgés mais pas chez les jeunes.

Ce graphique montre l’interaction entre le tabagisme mesuré en nombre de cigarettes fumées par jour, la prise de contraception oraux (jamais / passée / actuelle) et le risque d’infarctus.

 On voit que quand on ne fume pas et quand on n’a jamais pris de contraceptifs oraux, on a un risque en bleu (caché derrière le vert et le rouge).  Par rapport à ce risque de base des personnes qui ne sont exposées à aucun facteur de risque, si on prend des contraceptifs oraux, le risque n’est pas modifié ou alors de façon infinitésimale. Sans fumer, le risque associé aux contraceptifs oraux est négligeable.  Si on fume plus de 15 cigarettes par jour, le risque d’infarctus est un peu augmenté et vaut environ 3.  Mais si on fume plus de 15 cigarettes par jour en prenant des contraceptifs oraux, le risque n’est pas celui des 15 cigarettes par jour additionné à celui de la prise de contraceptifs oraux, mais il est démultiplié. Il y a un effet d’interaction entre la prise de contraceptifs oraux et le tabagisme qui fait que l’effet n’est pas additif mais multiplié même bien plus que par la seule multiplication des 2 risques, ce qui signe la présence d’un facteur d’interaction entre ses 2 facteurs de risque.

L’interaction mise en évidence est pertinente sur le plan statistique lorsque que l’on peut démontrer qu’il y a un facteur d’interaction significatif par un test statistique particulier ayant une p-value significative. Si en plus, cette interaction est pertinente sur le plan clinique et qu’il existe des prises en charge différenciées entre les patients alors on peut poursuivre cette analyse dans les sous- groupes de F, tels que les sous-groupes d’âge, de prise ou non de contraceptifs oraux, de consommation ou non de tabac... En effet, l’analyse globale, moyennée ne donnera pas plus d’information intéressante. Si on sait possible d’individualiser les résultats, autant le faire. Par exemple, si on a un vaccin efficace uniquement chez les hommes et pas chez les femmes, ce qui serait montré par une interaction entre le sexe et le vaccin sur l’incidence de la pathologie, alors il n’y aurait aucun intérêt à présenter les résultats tout sexe confondu.

III – Neutralisation des facteurs de confusion

1 – Lors de la sélection des sujets

On peut randomiser dans une étude expérimentale, ce qui représente l’unique moyen d’être sûr de ne pas avoir de facteur de confusion lors de l’étude de l’association entre 2 variables.

On peut aussi restreindre la population d’étude au risque de provoquer des biais de sélection, ce qui nécessite de discuter de la maitrise des facteurs de confusion par cette manière puisqu’en voulant neutraliser un type de biais, on en introduit un nouveau.

On peut apparier sur 1 ou 2, rarement sur 3 facteurs en faisant toujours bien attention au risque de sur-appariement. De plus, cette méthode ne va équilibrer que sur les facteurs sur lesquels on a effectué l’appariement.

2 – Lors de l’analyse

Généralement dans les études observationnelles, puisqu’on ne peut pas randomiser, on va continuer, lors de l’analyse statistique, à neutraliser les biais de confusion potentiels. Ce qui s’effectuera en ajustant sur les facteurs de confusion, soit par des analyses stratifiés (méthode de Mantel-Haenszel), soit par des modèles multivariés, soit par la standardisation.

A – L’analyse stratifiée (méthode de Mantel-Haenszel)

Par exemple, on a calculé un OR brut montrant l’association entre bonbon à la menthe et maladie cardio-vasculaire. L’OR brut est égal à 2,33 et significatif (son IC95% 1). Comme on se doute que le tabac est un facteur de confusion, on va réaliser une analyse stratifiée pour étudier l’association entre bonbon à la menthe et maladie cardio-vasculaire

survenue d’infection au VHC en fonction de la sévérité de l’AES, du dispositif utilisé (aiguille creuse ou pleine), de la charge virale du patient (détectable au non au moment de l’AES)...

Dans le modèle univarié, il n’y a pas de prise en compte du facteur de confusion, on ne pourra avoir que des mesures d’association (RR ou OR) brutes (= univariées). Le modèle multivarié permettra d’avoir des mesures d’association multivarié (= ajustées = indépendantes des facteurs de confusion).

Le modèle multivarié va permettre d’estimer l’effet propre de chaque facteur Ei sur Y indépendamment des autres facteurs inclus dans le modèle. On aura un RR ajusté sur tous les autres facteurs du modèle et ce pour chaque facteur pris en compte dans le modèle multivarié. Autrement dit, à chaque facteur Ei est associé un paramètre βi qui quantifie l’association entre Ei et la réponse Y, ajustée sur les autres variables du modèle (à niveau égal des variables incluses dans le modèle). Cette seule analyse statistique donnera beaucoup de réponses.

Un modèle est univarié quand il n’y a qu’une variable explicative. Un modèle multivarié a plusieurs variables explicatives et pour chacune des variables du modèle on aura une mesure de l’effet propre de cette variable.

C – Méthodes d’estimation

Par exemple, sur ce graphique, on a le cortisol sanguin en X et le cortisol salivaire en Y. L’analyse de chaque patient correspond à un point. On cherche à savoir si le cortisol sanguin explique la valeur du cortisol salivaire. A partir du nuage de points, on se dit qu’une droite va bien représenter la situation. Un modèle linéaire, qui est une fonction qui s’écrit comme une équation de droite représentera bien la situation. On cherche donc pour tracer au mieux notre droite, la meilleure valeur de l’ordonnée à l’origine et du coefficient directeur.

En faisant une régression linéaire, on demande à l’ordinateur à partir du nuage de points de déterminer l’équation précise de la droite qui se rapproche le mieux de tous les points. Donc la droite qui représente le mieux le lien entre cortisol sanguin et salivaire. Le logiciel calcule la bonne valeur de l’ordonnée à l’origine et la bonne valeur de la pente pour avoir une droite représentant au mieux l’ensemble des points. Ici, Y = 2 + 2X. On va interpréter la mesure d’association entre le cortisol sanguin et salivaire correspondant à la pente de la droite. Le coefficient directeur égal à 2 signifie que

statistiquement quand on augmente d’1 unité la valeur de cortisol sanguin, le cortisol salivaire va augmenter de 2 unités.

On cherche à estimer l’équation de la droite selon un modèle de régression linéaire.

L’estimateur de α est a et de β est b. La valeur de α ne s’interprétera pas puisque l’ordonnée à l’origine n’a pas de réalité clinique. Il n’y aura aucun patient avec un cortisol sanguin à 0 (si ce n’est les morts mais bon du coup, on ne va pas trop aller mesurer leur cortisol). On étudiera par contre la pente qui représente l’augmentation moyenne de Y par unité de X.

  • Si β =0, alors Y ne varie pas en fonction de X donc il n’y a pas d’association statistique entre X et Y. La valeur de cortisol sanguin n’aurait pas d’influence sur la mesure du cortisol salivaire.
  • Si β > 0 alors Y augmente quand X augmente.
  • Si β < 0 alors Y diminue quand X augmente.

Un modèle linéaire avec une seule variable explicative est un modèle linéaire univarié donnant une pente brute. En faisant le même procédé avec plusieurs variables, on aurait un modèle linéaire multivarié. On pourrait faire un nuage de points en 3 dimensions où on aurait le point de naissance en Y, l’âge de la mère en X et le poids de la mère avant la grossesse en W. La droite de ce modèle en 3D, Y = a + bC +cW, nous donnerait la pente du poids de l’enfant en fonction de l’âge de la mère mais aussi la pente du poids de l’enfant en fonction de celui de la mère avant la grossesse. On aurait ainsi l’effet du poids de la mère indépendamment de l’âge la mère et inversement. Avec 10 variables explicatives, on peut faire un nuage de points en 10 dimensions, ce qui ne se représente pas graphiquement mais donne une équation avec les 10 covariables et avec la pente ajustée sur tous les autres variables du modèle.

D – Choix du modèle

Si X est une variable quantitative comme le poids de l’enfant, on peut faire un modèle de régression linéaire multiple. L’interprétation se fait grâce à la pente β de la droite (et son intervalle de confiance à 95%) correspondant à l’augmentation moyenne de Y par unité de X). La valeur neutre est 0.

Si le critère de jugement est binaire (par exemple : être malade/ne pas être malade), on va utiliser une régression logistique. Les calculs sont plus compliqués donc non expliqués. Cette régression logistique donnera un OR qui s’interprète comme un RR si le phénomène étudié est rare. La valeur neutre étant 1.

Si le critère de jugement est une variable censurée , on utilisera u modèle de cox (=modèle à risque proportionnel) dont les résultats des mesures d’association sont des hazard ratio qui sont la moyenne des RR instantanés, et s’interprète donc pareillement, la valeur neutre étant 1.

Ce document a-t-il été utile ?

Facteur de confusion, interactions et analyses multivariées

Matière: Lecture critique d'article

27 Documents
Les étudiants ont partagé 27 documents dans ce cours
Ce document a-t-il été utile ?
Facteurs de confusion, interaction et analyses
multivariés
Table des matières
I – Biais de confusion..........................................................................................................1
1 – Définition................................................................................................................................2
2 – Exemple : Infection et décès....................................................................................................2
3 – Résultat et interprétation de l’ajustement...............................................................................4
II – Interaction ou modification deffet................................................................................5
1 – Suite des résultats et de l’interprétation de l’ajustement de l’exemple précèdent...................5
2 – Définition de l’interaction.......................................................................................................6
III – Neutralisation des facteurs de confusion......................................................................8
1 – Lors de la sélection des sujets..................................................................................................8
2 – Lors de l’analyse......................................................................................................................8
3 – Standardisation.....................................................................................................................12
Objectif :
Définir ce qu’est un biais de confusion
Citer les principaux moyens de contrôle des biais de confusion aux différents temps d’une
recherche clinique
Expliquer le principe d’une analyse stratifiée, d’un modèle multivarié et d’une standardisation
dans la prise en compte de facteur de confusion
Identifier le modèle adapté à la nature de la variable d’intérêt et savoir en interpréter le
résultat
Différencier un biais de confusion et une interaction (effet modulateur)