respir.com
respir.com
 

Un site de la Fédération Girondine de Lutte contre les Maladies Respiratoires
Association loi de 1901 reconnue d'utilité publique
respir.com

La Revue de RespirWebConférencesDiaporamas & PrésentationsInscriptionContact

Respir.com est un site gratuit mis en ligne pour tous par la FGLMR. Il n'a pas recours à la publicité.

S'il vous est utile, aidez-nous à le maintenir en ligne (Cliquez ici).

base documentaire
contact
collaborateurs
recherche approfondie
imagerie
bibliographies
formation santé
Université de Bordeaux II
tabacologie
cas cliniques

Quelques éléments utile à la lecture critique

Créé le 09/05/2004 Auteur : A. Taytard (Mis à jour le 09/01/2007)
Révisé le 09/01/2007 C. Raherison  
     

Quelques questions lorsqu'on analyse un article
Quelle question a été posée par les auteurs ?
Comment les auteurs ont-ils répondu à la question posée ?

quels types de données ont ils obtenu et ont ils utilisés les tests statistiques appropriés ?
si les auteurs ont utilisé un test statistique peu connu, pourquoi l'ont ils fait et l'ont ils référencié ?
est ce que les données ont été analysées selon le protocole d'origine ?
est que des tests pairés ont été réalisés sur les données pairées ?
est ce qu'un test bilatéral a été réalisé chaque fois que l'effet d'une intervention pouvait raisonnablement être négatif ?
est ce que les points extrêmes ont été analysés avec bon sens et des ajustements statistiques appropriés ?
Quelle est la signification des résultats?

Ajustement
Il permet d’estimer l’effet spécifique d’un facteur sur un critère de jugement, en prenant en compte les biais induits par un déséquilibre des co-variables pronostiques (facteurs de confusion) entre les groupes ; ces co-variables doivent être définies a priori.
Il n’est possible que sur les facteurs de confusion connus ; mais il reste la possibilité de biais dû à des facteurs de confusion inconnus.
Il peut être utile si, malgré une randomisation, un déséquilibre existe entre les groupes.
L’ajustement, non prévu a priori, doit rendre prudent lorsqu’il est indispensable pour atteindre la signification statistique.
La nécessité d’y recourir doit toujours faire suspecter un biais dans le résultat.

Appariement
On cherche à rendre 2 groupes aussi proches que possible en matière de facteurs de confusion potentiels ; on associe un sujet à un ou plusieurs sujets similaires.

Biais
Erreur systématique liée à la méthode.
biais d'attrition : malades perdus de vue, exclus de l'étude ou de l'analyse ; ils sont généralement différents des sujets restés dans l'étude ; peut être limité par l'analyse des sujets perdus de vue ;
biais d'évaluation : lié à la subjectivité de l'expérimentateur ; conduit à choisir un évaluateur externe, même en cas d'étude randomisée ;
biais de classement : malade classé dans la mauvaise catégorie ;
biais de confusion : lié à l'absence de prise en compte d'un facteur pouvant jouer simultanément sur le critère de jugement et le facteur de risque ; peut être minimisé par l'ajustement ;
biais de sélection : les groupes ne sont pas comparables (ex : comparaison historique) ;
biais de suivi : lié aux déviations de protocole, aux traitements associés différents...

Cas cliniques
On décrit l'histoire clinique d'un patient ; on peut aussi décrire une série de cas.
Sert à illustrer un aspect d'une maladie, un traitement, un effet secondaire.

Causalité (Critères de Bradford, Hill)
Elle implique :
une association statistique
une association forte (OR > 2)
une association robuste d'une étude à l'autre
une relation temporelle appropriée
un effet dose-réponse
que ce qu'on a trouvé a du sens en termes épidémiologiques, biologiques
une association spécifique
une analogie avec une association causale précédemment trouvée

Corrélation
Le coefficient de corrélation de Pearson (r)
permet de savoir si deux variables quantitatives (aléatoires) sont indépendantes ou liées
Il n'est valide que si
les données sont normalement distribuées
les 2 groupes de données sont indépendants
une seule paire de mesures est faite sur chaque sujet (sinon il faut utiliser une analyse de variance)

Courbe ROC (receiver operating characteristic)
Elle met en relation la sensibilité et la spécificité d'un test.
Si on emploie un test pour exclure un diagnostic, sa sécurité est déterminée par la sensibilité (on admet le moins possible de faux négatifs).
Si on emploie un test pour porter un diagnostic, sa sécurité est déterminée par sa spécificité (on admet le moins possible de faux positifs)

Critères de jugement ayant un sens clinique
symptômes
capacité à mener ses activités quotidiennes : nocturnes (sommeil) ; diurnes (intérieur, extérieur)
exacerbations
survie/mortalité
Ces critères doivent être biens définis, fiables, mesurables, interprétables et sensibles aux effets des interventions thérapeutiques.
La mortalité peut s'envisager : toutes causes, liée à la respiration, liée à la maladie testée.
La mortalité toutes causes a l'avantage d'être bien définie, fiable, facile à mesurer et de prendre en compte tous les effets potentiels en lien avec elle.
L'hospitalisation peut s'envisager : toutes causes, liée à la respiration, liée à la maladie testée.
Sa limite est qu'elle est liée à des facteurs non liés à la maladie comme l'accès aux soins, le soutien social, les pratiques locales.
Un critère de remplacement n'est valide que si sa réponse à une intervention prédit l'effet de l'intervention sur le critère de jugement qu'il remplace.
Un critère composite est fait de deux ou plusieurs critères particuliers combinés. Il permet de mieux évaluer le bénéfice clinique net d'une intervention ; mais il perd en spécificité et son interprétation est plus difficile.

Dispersion de la distribution
Etendue : différence entre la valeur maximale et la valeur minimale ; très sensible aux extrêmes.
Quantiles : on divise les données en parties égales ; le plus souvent, on utilise des quartiles en divisant les données en 4 parties égales de 25 % (percentile) ; écart interquartile = distance entre le 1er et le 3ème quartile.
Ecart-type (standard deviation) : valable pour décrire une variable de distribution normale ; 95 % des observations se situent entre la moyenne ± 2 écart-types.
Ecart-type de la moyenne (standard error of the mean) : si on s'intéresse à des groupes d'échantillons, on peut calculer la moyenne des moyennes obtenues avec chaque échantillon. Cet indice décrit la précision de l'estimation de la moyenne dans un échantillon, il ne décrit pas la dispersion des observations autour de la moyenne (écart-type).

Distribution
La plus connue est la distribution "normale" ou gaussienne (loi normale avec 2 paramètres : moyenne ; écart-type). Une distribution peut êtrenormale dans une population générale, et ne pas l'être dans la population considérée, surtout dans les petits échantillons.
Paramètres de position : médiane, moyenne, quartile...
Paramètres de dispersion : intervalles interquartiles, écart-type, variance...
Coefficient décrivant la forme d'une distribution : coefficient de symétrie (skewness); coefficient d'aplatissement (kurtosis)
Tests permettant d'affirmer la normalité d'une distribution : méthodes graphiques, Kolmogorov-Smirnov ; Shapiro-Wilk (le plus utilisé)
.

Ecart-type
Mesure la dispersion des valeurs autour de la moyenne.

Efficacité diagnostique
Pourcentages de bien classés par le test : (vrais positifs + vrais négatifs / malades + non malades)

Essais contrôlés randomisés
Avantages
permet l'évaluation rigoureuse d'une variable unique sur un groupe de patients précisément défini
essai prospectif
utilise une logique hypothético-déductive
évite (potentiellement) les biais, les groupes étant considérés, a priori, comme identiques
permet les méta-analyses
nconvénients
coûteux en temps et en argent avec, comme conséquences :
beaucoup d'essais ne sont jamais faits, ou sur de petits groupes de sujets ou sur une période trop courte
la plupart sont réalisés par des institutions ou l'industrie pharmaceutique
des critères de remplacement ou équivalents sont souvent préférés aux résultats cliniques, pouvant introduire des biais cachés à travers : randomisation imparfaite, absence de randomisation de tous les patients éligibles, pas d'"aveugle".

Essai de non infériorité
Se fait lorsqu'il existe un traitement de référence qu'il serait non éthique de remplacer par un placebo ; on compare le nouveau médicament au traitement de référence en cherchant à montrer qu'il n'est pas moins efficace.
On pourra ensuite essayer de montrer qu'il a d'autres avantages (mieux toléré, plus facile à administrer, moins cher...).
On définit un seuil de non infériorité et l'intervalle de confiance à 95 % de la moyenne de la difféérence d'efficacité sur le critère choisi ne doit pas inclure le seuil défini. L'efficacité du traitement de référence doit être conforme aux données de la littérature.

Etudes cas-contrôle
Les sujets sont appariés à des contrôles.
La difficulté vient de la définition précise du "cas".
On ne montre ici qu'une association, pas une relation de cause à effet.

Etudes de cohortes
2 ou plusieurs groupes de sujets sont sélectionnés sur la base de leur exposition à un agent, puis suivis (généralement sur plusieurs années) pour voir combien de sujets dans chaque groupe développent le problème étudié (maladie, complications, autre) ; elles permettent de calculer un risque relatif.
Elles permettent de définir des facteurs pronostiques.
Il faut que les évènements étudiés soient suffisamment nombreux et proches car il est difficile de mener des cohortes très importantes sur des périodes très prolongées.

Etudes transversales
Les données sont recueillies à un moment précis.

Hazard ratio
Basé sur la notion de risque instantané de décès dans un modèle de Cox par rapport à une variable donnée. Il s'agit de la modélisation de la probabilité de décès que l'on a dans une courbe de Kaplan-Meier.
En dessous de 1 : diminution du risque de décès dans le groupe étudié.
Au dessus de 1 : augmentation du risque de décès.
L'intervalle de confiance ne doit pas contenir 1 pour la significativité statistique des résultats.

Incidence
Nombre de nouveaux cas apparaissant, dans une période donnée, dans la population considérée.

Intention de traiter (analyse en)
Tous les sujets inclus dans l'étude sont inclus dans l'analyse statistique qu'ils aient, ou non, reçu le traitement attribué par tirage au sort.
Cette approche répond à la réalité clinique, celle de la pratique.
Mais on peut ausssi pratiquer une
analyse par protocole : ne prend en compte que les patients qui ont réalisé l'étude selon le protocole et avec toutes les mesures prévues ;
analyse en traitement reçu : analyse en fonction du traitement réellement reçu quel que soit le bras dans lequel le malade avait été randomisé ;
analyse intermédiaire : réalisée à des moments prévus dans le protocole pour conclure plus précocément, surtout dans les études longues ;
analyse séquentielle : réalisée après l'inclusion de chaque patient pour avancer au maximum le moment de la conclusion.
Si l'analyse en intention de traiter d'une procédure thérapeutique ne montre pas d'efficacité mais qu'il apparait une efficacité sur un sous-groupe, il y a un fort risque que la procédure soit néfaste pour les autres groupes.
L'analyse en sous-groupes permet de générer des hypothèses à tester dans de nouveaux essais.

Intervalle de confiance (IC)
Intervalle dans lequel la vraie valeur a de bonnes chances de se trouver.
Il peut être calculé pour différents niveaux de confiance : 90 %, 95 %, 99 %.
Cela signifie que sur 100 intervalles de confiance, 95 contiendront la moyenne théorique et 5 ne la contiendront pas ; on est sûr à 95 % que la moyenne est dans l'intervalle calculé.
Lorsque la taille de l'échantillon augmente, l'intervalle de confiance diminue car la précision de l'estimation augmente. Lorsque l'échantillon recouvre toute la population, l'intervalle de confiance est égal à 0.
Si IC est calculé pour une différence (de 2 moyennes ou de 2 proportions : différence de risque), les différences sont significatives si l'intervalle ne contient pas 0.
Si IC est calculé pour un rapport (de proportion : risque relatif ; ou de cotes : odds ratio), les différences sont significatives si l'intervalle ne contient pas 1.

Kappa (coefficient) : Comparaison de l'interprétation d'un test par 2 observateurs
Concordance : proportion de sujets pour lesquels il y a accord entre les observateurs.
le coefficient kappa est d'autant plus proche de 1 que la concordance est bonne mais la mesure doit être interprétée en fonction du contexte. On considère habituellement comme "bon" un coefficient kappa > 0,6.
Le coefficient kappa pondéré est utilisé lorsqu'on souhaite pondérer des discordances plus "graves" que d'autres.
A noter :http://kappa.chez.tiscali.fr sur le sens et l'utilisation de ce coefficient.

Latéralité
Un test est
bilatéral lorsqu'on ne sait pas, a priori, quel sera le sens de la différence entre les groupes étudiés,
unilatéral, lorsque la différence ne peut se faire, ou n'a d'intérêt, que dans un sens.

Méta-analyses

Méthode univariée
Evalue le lien entre une variable à expliquer et une variable explicative ; permet de comprendre les relations existant entre ces variables.

Méthodes multivariées
Evalue le lien entre une variables à expliquer et plusieurs variables explicatives (régression multiple, régression logistique, modèle de Cox) ;fait suite à une méthode univariée.

Moyenne, médiane
Moyenne : moyenne arithmétique ; valide si la variable est distribuée selon une loi normale, sinon, utiliser la médiane.
Médiane : on classe les observations par ordre croissant ; médiane =observation de rang (nombre d'observations + 1)/2

Le "p"
La valeur de p est un moyen de distinguer les effets réels des effets dus au hasard, mais elle ne dit rien sur l'importance de l'effet.
Une valeur de p significative dit que la différence n'est pas "0".
0.05 : il est peu probable que la différence soit "0"
0.01 : il est vraiment peu probable que la différence soit "0"
0.0001 : il est très, très peu probable que la différence soit "0"
Elle dépend de 3 éléments :
la différence entre les moyennes ; plus la différence sera grande, plus la valeur de p sera petite
la déviation standard des observations individuelles ; plus elle sera petite, plus la valeur de p sera petite
la taille de l'échantillon ; plus il sera grand, plus la valeur de p sera petite

Plan expérimental
groupes parallèles : sujets randomisés en 2 groupes
chassé-croisé (cross-over") : le sujet est son propre témoin en testant successivement les 2 traitements à l'essai
factoriel : sert à évaluer la contribution de chaque traitement d'une association ; si l'association est faite de 2 traitements il y aura 4 groupes parallèles (A/B ; A/placebo de B ; B/placebo de A ; placebo de A/placebo de B)

Puissance
Risque a (risque de première espèce) : risque de conclure à tort à une différence lorsqu'il n'y en a pas.
Risque b (risque de deuxième espèce) : risque de ne pas voir une différence qui existe vraiment.
Puissance : probabilité (généralement à 80 %) de détecter une différence lorsqu'elle existe réellement.
Cela permet de déterminer le nombre de sujets nécessaires pour obtenir la puissance souhaitée.

Rapport de cote : Odds ratio (OR)
Odd : mesure d'effet relatif calculé comme un rapport de 2 probabilités complémentaires : probabilité P qu'un évènement survienne / probabilité 1-P que cet évènement ne survienne pas.
Odds ratio : rapport des "odds" dans 2 populations différentes (exemple : groupe exposé vs groupe non exposé).
L'odds ratio est une meilleure approximation du risque relatif lorsque le risque, dans l'un des groupes, est faible (< 10 %)

Rapport de vraisemblance (likelyhood ratio)
Quantifie la vraisemblance d'un diagnostic fourni par un test positif ; rapport de la probabilité qu'un test positif corresponde réellement à la maladie par rapport à la probabilité qu'un test positif ne corresponde pas à la maladie.

Régression
Le choix du qualificatif final utilisé, régression ou corrélation, n'est pas fondamental.
La régression implique qu'une variable (contrôlée) peut être prédite par une ou plusieurs autres

Risque
absolu : risque de développer une maladie dans un groupe exposé
relatif : rapport du risque dans le groupe A sur celui du groupe B
différence de risque : fréquence chez les exposés moins fréquence chez les non exposés
réduction relative de risque : différence de risque rapportée au risque dans le groupe non exposé

Sensibilité
Proportion de patients qui ont la maladie recherchée et dont le test est positif (vrais positifs).

Spécificité
Proportion de patients qui n'ont pas la maladie recherchée et dont le test est négatif (vrais négatifs).

Sujets à traiter
Nombre de sujets à traiter pour éviter l'apparition d'un nouveau cas (ou nouvelle complication).

Test paramétrique
Ils sont utilisables lorsqu'on peut faire une hypothèse sur la loi de distribution de la variable étudiée (le plus souvent, la loi normale) et donc utiliser les caractéristiques de cette loi (ex : moyenne, écart-type pour laloi normale).
Exemples : comparaison de
2 pourcentages : variables indépendantes : Chi2 (et ses variantes) ; appariées: Chi2 de Mac Némar
2 moyennes : variables indépendantes : écart réduit, Student ; appariées : écart réduit apparié, Student apparié
plus de 2 moyennes : variables indépendantes : analyse de variance ; appariées : variance à 2 facteurs
2 variables quantitatives : coefficient de corrélation

Test non paramètrique
Utilisés dans de petits échantillons lorsqu'on n'a pas d'hypothèse sur la loi de distribution... ou lorsqu'on n'en fait pas.
On utilise le rang de chaque variable dans la distribution.
Moins puissant que les tests paramétriques.
Exemples : comparaison de :
2 séries : indépendantes : Mann et Whitney ; appariées : Wilcoxon apparié
plus de 2 séries : indépendantes : Kruskal et Wallis ; appariées : Friedman
2 variables quantitatives : coefficient de Spearman

Valeur prédictive
positive : probabilité d'avoir la maladie en cas de test positif (VPP)
négative : probabilité de ne pas avoir la maladie en cas de testnégatif (VPN)

Variance (analyse de)
Classiquement, toute variable quantitative se décrit par : une étendue, un intervalle inter-quartile, et un écart-type.
L’étendue représente l’écart entre la plus grande et la plus petite mesure
L’intervalle inter-quartile est défini par deux bornes délimitant les quarts supérieurs et inférieurs des données.
L’écart-type correspond à la moyenne des valeurs absolues des écarts par rapport à la moyenne.
La variance est le carré de son écart-type ; c’est donc une mesure de dispersion des observations (moyenne des carrés des écarts).
L’analyse de variance permet de comparer
- deux groupes : c’est l’utilisation du test T (analyse univariée).Sila différence observée est plus du d oubleque son erreur d’estimation, on conclura que la différence est significative,sinon on conclura que la différence est compatible avec le hasard. (conditionsde validité : si les observations ont indépendantes, si la distributionsuit une loi normale)
- plusieurs groupes : c’est l’ANOVA. Elle consiste à comparer deux sources de variance : variance entre les groupes et variance résiduelle au sein des groupes. Si la variance entre les groupes n’est pas plus grande que la variance des observations au sein des groupes, les différences observées ne sont que le reflet des aléas liés à l’échantillonnage. Il n’y a donc pas de différence réelle entre les moyennes des populations. (conditions de validité : si les observations sont indépendantes, si la distributionsuit une loi normale).

Au total, lorsqu'on compare 2 traitements
1/ on rejette l'hypothèse nulle il y a une différence
2/ p permet de dire que, à n % près, le hasard seul ne permet pas d'expliquer la différence observée
3/ cela ne veut pas dire forcément que c'est le traitement ; d'autres facteurs peuvent être pris en compte ; c'est ce que cherche à éviter une bonne randomisation
4/ cela a t-il une significativité clinique ?

Réf:
Chatelier G, Durieux P. Moyenne, médiane et leurs indices de dispersion : quand les utiliser et comment les présenter dans un article scientifique ? Rev Mal Respir 2003;20:421-4
Dart T, Chatelier G. Comment décrire la distribution d'une variable ? Tests de normalité et traitement des valeurs extrêmes. Rev Mal Respir 2003;20:946-51
Dalmay F, Preux PM, Druet-Cabanac M, Vergnenègre A. Qu'est ce qu'un test non paramétrique ? Rev Mal Respir 2003;20:955-8
Fuhrman C, Chouaïd C. Concordance de deux variables : les approches numériques - Concordance entre observations qualitatives (coefficient kappa), concordances entre méthodes quantitatives. Rev Mal Respir 2004;21:123-5
Greenhalgh T. How to read a paper: Statistics for the non-statistician. I: Different types of data need different statistical tests. BMJ 1997;315:364-6
Greenhalgh T. How to read a paper: Statistics for the non-statistician. II: "Significant" relations and their pitfalls. BMJ 1997;315:422-5
Mélot C. Qu'est ce qu'un intervalle de confiance ? Rev Mal Respir 2003;20:599-601
Mélot C. Que signifie puissance d'une étude ? Comment la calculer ? Comment calculer le nombre de sujets nécessaires ? Rev Mal Respir2003;20:602-3
Morabia A. Risque relatif et odds ratio. Rev Mal Respir 2003;20:757-9
Nendaz MR, Perrier A. Sensibilité, spécificité, valeur prédictive positive et valeur prédictive négative d'un test diagnostique. Rev Mal Respir 2004;21:390-3
Norman GR, Streiner DL. Do CIs give you confidence? Chest 2012;141:17-9
Perneger T, Perrier A. Analyse d'un test diagnostic : courbe ROC ou "receiver operating characteristic". Rev Mal Respir 2004;21:398-401
Preux PM, Druet-Cabanac M, Dalmay F, Vergnenègre A. Qu'est ce qu'un test paramétrique ? Rev Mal Respir 2003;20:953-4
Méthodes statistiques à l'usage des médecins et biologistes 4 ème édition D. Schwartz Collection Statistique en biologie et en médecine. Médecine-Science Flammarion

Conflits d’intérêts : les auteurs n’ont pas transmis de conflits d’intérêts concernant les données publiées dans ce texte.

Ce site respecte les principes de la charte HONcode de HON Ce site respecte les principes de la charte HONcode.
Vérifiez ici.

Tous droits réservés
© Fédération Girondine de Lutte contre les Maladies Respiratoires (FGLMR) 2017

Usage strictement personnel. L'utilisateur du site reconnaît avoir pris connaissance de la licence de droits d'usage et mentions légales, en accepter et en respecter les dispositions.

Respir.com est enregistré à la C.N.I.L. sous le n°757727 VERSION 1