The Pan American Health Organization
Promoting Health in the Americas

 

—extrait du Bulletin Epidémiologique de l'OPS. Edition complète du No. 3, Vol. 23 (Septembre 2002) disponible en anglais et en espagnol


La Standardisation: Une Méthode Épidémiologique Classique pour la Comparaison des Taux

Introduction
L'un des principes de base de l'analyse de la situation sanitaire (ASIS) est la comparaison d'indicateurs de santé. Elle permet entre autre d'identifier des secteurs à risque, de définir des besoins et de documenter les inégalités de santé qui existent entre deux populations ou plus, entre les sous-groupes d'une même population, ou bien à différents moments dans une même population. Qu'ils représentent la mortalité, la morbidité ou d'autres événements de santé, les taux bruts sont des mesures qui résument la santé des populations et facilitent cette analyse comparative. La comparaison de taux bruts peut cependant parfois être inadéquate, en particulier lorsque les structures d'âge, par sexe ou niveau socio-économique des population ne sont pas comparables. En effet, ces facteurs et d'autres encore influencent le niveau des taux bruts et peuvent déformer leur interprétation, par un effet que l'on appelle de confusion (figure 1).(1, 2, 3)

Figure 1: Définition de l'effet de confusion

Un effet de confusion apparaît quand la mesure de l'effet d'une exposition sur un risque est déformée par la relation entre l'exposition et d'autres facteurs qui influencent également le résultat étudié. (1)

Un facteur de confusion doit remplir trois critères : 1) être un facteur de risque connu pour le résultat étudié (2), 2) être un facteur associé à l'exposition mais pas un résultat de l'exposition (2), et 3) être un facteur qui n'est pas une variable intermédiaire entre eux.

Un exemple de confusion est celui du tabagisme comme facteur confondant dans l'étude de la consommation de café comme facteur de risque de la maladie cardiovasculaire ischémique. L'association entre la consommation de café et la maladie cardiovasculaire ischémique peut être distortionnée par le tabagisme. En effet, le tabagisme est un facteur de risque connu pour la cardiopathie ischémique. Il est associé à la consommation de café, car les fumeurs sont d'habitude des consommateurs de café, mais ce n'est pas un résultat de la consommation de café. Le tabagisme n'est pas une variable intermédiaire entre la consommation de café et la maladie cardiovasculaire ischémique.

Le tabagisme est un facteur de confusion de l'association entre la consommation de café et la maladie cardiovasculaire ischémique.

Sources:
(1) Last J. A Dictionnary of Epidemiology. Fourth Edition. New York, New York: Oxford University Press. 2001
(2) Gordis L. Epidemiology. Second Edition. Philadelphia, PA: W.B. Saunders Company. 2000

Le calcul de taux spécifiques dans des sous-groupes de population bien définis est une façon d'éviter certains facteurs de confusion. L'on utilise par exemple souvent les taux spécifiques à des tranches d'âge pour examiner comment les maladies affectent les populations différemment selon leur âge. Cependant, même si cela permet d'en savoir plus sur les modèles de répartition des problèmes de santé dans la population, tout en permettant une comparaison plus rigoureuse des taux, il peut parfois être peu pratique de travailler avec un grand nombre de sous-groupes.(4) En outre, si les sous-groupes sont constitués de populations de petites tailles, les taux spécifiques peuvent être très imprécis. Le processus de standardisation (ou d'ajustement) des taux est une méthode épidémiologique classique qui enlève l'effet de confusion des variables dont l'on sait - ou pense - qu'elles diffèrent dans les populations que l'on veut comparer. Il fournit une mesure résumée facile à utiliser, qui peut être utile pour les utilisateurs de l'information, tels que les gestionnaires de la santé, qui préfèrent souvent avoir une image synthétique de l'état de santé de la population.
Dans la pratique, l'âge est un facteur d'ajustement fréquent. La standardisation selon l'âge est souvent utilisée dans les études comparatives de mortalité, car la structure d'âge a un impact important sur la mortalité totale d'une population. Par exemple, dans des situations avec des niveaux de mortalité totale modérée, comme la plupart des pays des Amériques, une structure de population plus vieille présentera toujours des taux bruts plus élevés qu'une population plus jeune.

Il existe deux méthodes principales de standardisation, qui dépendent du standard utilisé : soit la distribution d'une population (méthode directe), soit un ensemble de taux spécifiques (méthode indirecte). Les deux méthodes sont présentées ci-dessous.

Méthode directe
Dans la méthode de standardisation directe, l'on calcule les taux que l'on s'attendrait à trouver dans les populations étudiées si elles avaient toutes la même composition selon la variable que nous voulons ajuster ou contrôler (comme par exemple l'âge, le groupe socio-économique, ou d'autres caractéristiques). L'on utilise la structure d'une population appelée "standard", stratifiée selon la variable que l'on veut contrôler, et à laquelle l'on applique les taux spécifiques des strates correspondantes dans la population étudiée. L'on obtient ainsi le nombre de cas "attendus" dans chaque strate si les populations avaient la même composition. Le taux ajusté ou "standardisé" est obtenu en divisant le total de cas attendus par la population standard. Un exemple est présenté à la figure 2.

Le choix de la population-type représente une étape importante de la standardisation directe.(3) La valeur du taux ajusté dépend de la population-type utilisée, mais cette population peut être choisie de manière relativement arbitraire, car la valeur calculée n'a pas de signification particulière en elle-même. En effet, les taux ajustés sont le produit d'un calcul hypothétique et ne représentent pas les valeurs exactes des taux. Ils ne servent qu'à titre de comparaison entre des groupes, et non comme une mesure de magnitude abolue.(3) Certains aspects doivent cependant être pris en compte dans le choix de la population-type. La population-type peut provenir des populations étudiées (somme ou moyenne, par exemple). Dans ce cas cependant, il est important de s'assurer que les populations ne sont pas de taille très différentes, puisqu'une population de plus grande taille peut avoir une influence excessive sur les taux.(5) La population standard-type peut aussi provenir d'une population sans aucune relation avec les données étudiées, mais en général, sa distribution en ce qui concerne le facteur d'ajustement ne doit pas différer radicalement des populations à comparer.

L'étude comparative de taux ajustés peut être réalisée de diverses façons : l'on peut calculer la différence absolue entre les taux, leur proportion, ou le pourcentage de différence entre eux. Cette comparaison n'est évidemment valable que lorsque le même standard a été utilisé pour calculer les taux ajustés. Lorsque les standards nationaux changent (comme aux Etats-Unis en 1999 par exemple, lorsqu'un nouveau standard basé sur la population américaine de l'an 2000 a été adopté, au lieu de la norme de 1940), les séries doivent être recalculées à tous les niveaux. La mise à jour des populations-type fournit une norme commune plus actuelle. Pour la comparaison de taux de pays différents, la population standard utilisée par l'OMS et l'OPS est celle définie par Waterhouse.(6) La répartition en fonction de l'âge de cette population est présentée à la figure 3.

La méthode directe est la plus fréquemment utilisée. Cependant, elle requière des taux spécifiques correspondant aux strates de la variable d'intérêt dans toutes les populations que l'on veut comparer. Ces taux ne sont pas toujours disponibles. Même lorsqu'ils le sont pour tous les sous-groupes, ils sont parfois calculés sur de très petits nombres et peuvent donc être très imprécis. Dans ce cas, l'on recommande la standardisation indirecte.(3)

Figure 2: Comparaison des taux de mortalité générale standardisés pour l'âge au Mexique et aux Etats-Unis, 1995-1997, méthode directe



Dans cet exemple, la population-type utilisée est celle qu'on appelle "la vieille" population-type mondiale définie par Waterhouse (voir la figure 3). Le taux de mortalité brut pour tous les âges aux Etats-Unis pour 1995-1997 est de 8.7 pour 1,000 habitants. Au Mexique il est nettement inférieur : 4.7 pour 1,000 habitants. L'on peut conjecturer que le taux plus élevé aux Etats-Unis est dû à une structure de population plus vieille qu'au Mexique. L'on désire donc étudier les taux des deux pays, tout en contrôlant l'effet de la différence de structure d'âge.

Dans cet exemple, pour utiliser la méthode directe il faut disposer des éléments suivants:
- Les taux de mortalité spécifiques par strate de la caractéristique à contrôler, dans ce cas l'âge, dans chaque population (i.e. du Mexique et des Etats-Unis)
- Une population standard, stratifiée de la même manière

L'on calcule tout d'abord le nombre attendu de décès dans les deux pays, en appliquant le taux de chaque pays à la population standard (colonnes (4) et (5)). La somme de tous les groupes nous donne le total de décès attendu.

Pour calculer le taux ajusté, l'on divise ce total par la population standard totale. Dans ce cas, l'on obtient un taux de 6.4 pour 1,000 habitants au Mexique et 5.7 pour 1,000 habitants aux Etats-Unis.

   
Taux de mortalité spécifique par groupe d'âge pour 100 000 habitants, 1995-1997
Nombre de décès attendu
 
Population standard
(1)
Mexique
(2)
Etats-Unis
(3)
Mexique (4)=(1)x(2)/100 000
Etats-Unis
(5)=(1)x(3)/100 000
<1 2 400
1693,2
737,8
41
18
1-4 9 600
112,5
38,5
11
4
5-14 19 000
36,2
21,7
7
4
15-24 17 000
102,9
90,3
17
15
25-44 26 000
209,6
176,4
55
46
45-64 19 000
841,1
702,3
160
133
65+ 7 000
4 967,4
5 062,6
348
354
  100 000
639
574

 

Taux de mortalité ajusté pour l'âge (Mexique) = 6,4 pour 1 000 hab.
Taux de mortalité ajusté pour l'âge (Etats-Unis) = 5,7 pour 1 000 hab.

En éliminant l'effet de la différence de la structure de l'âge dans les deux pays, l'on obtient un taux plus élevé au Mexique qu'aux Etats-Unis. La conclusion de la comparaison des taux est inversée si l'on utilise des taux ajustés plutôt que des taux bruts.

 

 

Source des données: Pan American Health Organization. Perfiles de mortalidad de las comunidades hermanas fronterizas México - Estados Unidos Edición 2000 / Mortality profiles of the Sister Communities on the United States-Mexico border 2000 Edition. Washington, D.C.: OPS. 2000

 

Figure 3: Populations-type de Waterhouse
(mondiale et européenne)
Groupe d'âge (années)
Mondiale
Européenne
0
2 400
1 600
1-4
9 600
6 400
5-9
10 000
7 000
10-14
9 000
7 000
15-19
9 000
7 000
20-24
8 000
7 000
25-29
8 000
7 .000
30-34
6 000
7 000
35-39
6 000
7 000
40-44
6 000
7 000
45-49
6 000
7 000
50-54
5 000
7 000
55-59
4 000
6 000
60-64
4 000
5 000
65-69
3 000
4 000
70-74
2 000
3 000
75-79
1 000
2 000
80-84
500
1 000
85+
500
1 000
Total
100 000
100 000
Source: Waterhouse J. and Col. (Eds.). Cancer incidence in five continents. Lyon, IARC, 1976.

 

Méthode indirecte
La standardisation indirecte diffère dans la méthode et dans son interprétation. Un exemple d'ajustement utilisant la méthode indirecte est présenté à la figure 4. Au lieu d'utiliser la structure de la population-type, l'on utilise ses taux spécifiques et on les applique aux populations à comparer, que l'on a tout d'abord stratifiées selon la variable à contrôler. De cette façon, l'on obtient le total de cas attendus. Le Rapport de Mortalités Standardisées (RMS) est alors calculé en divisant le total de cas observés par le total de cas attendus. Ce rapport permet de comparer chaque population à la population standard. L'on peut aboutir à une conclusion en calculant et en examinant le RMS. Un RMS plus élevé que 1 (ou que 100, si on l'exprime en pourcentage), indique que le risque de mourir dans la population observée est plus élevé que ce à quoi l'on s'attendrait si elle était exposée au même risque que la population standard. D'autre part, un RMS plus petit que 1 (ou 100) indique que le risque de mourir est inférieur dans la population observée que ce à quoi l'on s'attendrait dans la population de référence. Les taux ajustés peuvent aussi être calculés par la méthode indirecte en multipliant le taux brut de chaque population par son RMS.(4) Comme dans le cas de la méthode directe, une valeur simple est obtenue pour chaque population qui, bien qu'elle représente seulement un nombre artificiel, tient compte des différences de composition des populations.

Le Rapport de Mortalités (ou Morbidités) Standardisées est fréquemment utilisé en épidémiologie pour comparer différents groupes, parce qu'il est faciles à calculer, mais également parce qu'il donne une idée du risque relatif entre la population standard et la population étudiée. Cependant, il est important de savoir qu'il existe des situations dans lesquelles cette comparaison n'est pas adéquate, comme par exemple lorsque les rapports des taux dans les groupes étudiés et dans la population de référence ne sont pas homogènes dans les différentes strates.(7) Cependant, la comparaison entre chaque groupe et la population de référence est toujours appropriée. Le RMS de causes différentes dans une population peut aussi être calculé, en utilisant le même standard.

Figure 4: Utilisation de la méthode indirecte de standardisation pour comparer la mortalité dans l'état colombien de Vichada et en Colombie en général, 1999


Le taux de mortalité brut en Colombie en 1999 était de 4.4 pour 1 000 habitants, avec des variations entre 1.8 pour 1,000 habitants dans le département de Vichada et 6.9 pour 1 000 à Quindio.(1) L'on voudrait étudier les possibles différences significatives entre la mortalité observée (ou le risque de mourir) dans le pays et dans ses différents départements. Le cas de l'état de Vichada est présenté dans cet exemple.

Dans ce cas, pour utiliser la méthode indirecte nous avons besoin des éléments suivants:
- Les taux de mortalité spécifiques par tranche d'âge en Colombie
- La population de l'état de Vichada, stratifiée par âge
- Le nombre total de décès observés dans le département de Vichada

La première étape consiste à calculer le nombre attendu de décès à Vichada en appliquant les taux standards à la population du département (colonne (3) = (1) x (2)). Ensuite, les décès calculées sont additionnés et le RMS est calculé en divisant le nombre total de décès observés par les décès attendus.


 

Taux de mortalité spécifiques par groupe d'âge, Colombie, 1999 (i)

(1)

Population du département de Vichada (i)

(2)

Décès observés à Vichada

(3)

Décès attendus à Vichada, 1999 (i)
0-4
339
11 392
61
39
5-14
34
21 930
5
7
15-44
219
38 244
27
84
45-64
752
7 083
22
53
65 +
4.573
1 839
27
84
 
80 488
142
267


RMS (%) pour Vichada = (142/267) x 100 = 53%

La valeur du RMS montre que le risque de mourir à Vichada est 47% moins élevé que ce que l'on espérerait en fonction des standards de mortalité dans toute la Colombie, en contrôlant la variable âge.

 

Source des données:
(1) Ministerio de Salud de Colombia, Instituto Nacional de Salud de Colombia, Representación de la OPS/OMS en Colombia. Situación de Salud en Colombia, Indicadores Básicos 2002. Bogotá, Colombia: Ministerio de Salud, OPS; 2002.

 

NOTE : intervalle de confiance pour le RMS

L'intervalle de confiance fournit l'étendue des valeurs dans lesquelles nous nous attendons à trouver la valeur réelle de l'indicateur étudié, avec une probabilité donnée. De cette façon, il donne une estimation de la différence potentielle entre ce qui est observé et ce qui arrive vraiment dans la population, ce qui aide dans l'interprétation de la valeur de l'indicateur observé. L'intervalle de confiance de 95 % est le plus utilisé. Comme indiqué précédemment, il présente la gamme de valeurs dans laquelle l'on s'attend à trouver la valeur réelle de l'indicateur, avec une probabilité de 95 %.

Dans le cas du RMS, le calcul de l'intervalle de confiance peut être effectué de façon suivante :
1) L'on calcule tout d'abort l'érreur-type (ET) du RMS en utilisant la formule suivante :
ET = RMS/(racine carrée des décès observés)

2) L'Intervalle de Confiance de 95 % (IC) est ensuite calculé comme suit :
IC (95%) : RMS± (1,96 x ET)
où 1.96 est la valeur de la distribution Z avec un niveau de confiance de 95 %. L'on assume que les valeurs suivent une distribution normale.

 

Dans cet exemple, l'ET pour Vichada este de 4,4 et le CI (95%) = [44,4 ; 51,6]
L'intervalle de confiance indique que l'on sait avec une probabilité de 95% que la valeur du RMS se situe entre 44,4 et 61,6.

 

 

Conclusion
Comme avec n'importe quelle mesure résumée, les taux ajustés peuvent cacher de grandes différences entre des groupes, qui peuvent avoir de l'importance pour expliquer des changements dans les taux dus à ou associés à la variable à ajuster, par exemple. Néanmoins, il est important d'analyser les taux spécifiques avec les taux ajustés, dans la mesure du possible. Lorsqu'elles sont utilisées dans une même population, les deux méthodes doivent conduire aux mêmes conclusions. Si cela n'est pas le cas, il existe un facteur dans les différentes strates de la population qui exige une recherche plus approfondie.(4)

Une des raisons de l'utilisation parfois limitée de ces méthodes est le manque d'outils ou d'instruments qui les simplifient. Pour répondre à ce besoin, la Direction Générale de Santé publique de la Xunta de Galice et le Programme Spécial pour l'Analyse de la Santé de l'OPS ont développé le programme informatique "EpiDat" pour l'analyse de données tabulées. EpiDat est distribué gratuitement via Internet à l'adresse suivante: http://www.paho.org/Spanish/SHA/epidat.htm. Une version plus récente de ce programme sera publiée bientôt. Le logiciel SIGEpi (voir le document en anglais: http://www.paho.org/English/sha/be_v22n3-SIGEpi.htm), qui rassemble des capacités de système d'information géographiques avec des outils épidémiologiques, permet également de calculer des taux ajustés.

En bref, les taux ajustés permettent des comparaisons plus exactes entre des populations. Cela est important parce qu'ils peuvent conduire à la mise en place de priorités entre des groupes. Néanmoins, les taux bruts sont les seuls indicateurs de la dimension réelle ou de l'ampleur d'un problème, et conservent donc toute leur valeur comme outil de la santé publique.

Références:
(1) Last J. A Dictionary of Epidemiology, Fourth Edition. New York, New York: Oxford University Press. 2001
(2) Jenicek M, Cléroux R. Epidemiología: Principios, Técnicas y Aplicaciones. Barcelona, España: Salvat Editores. 1987
(3) Gordis L. Epidemiology. Philadelphia, PA: W.B. Saunders Company. 1996
(4) Pagano M, Gauvreau K. Principles of Biostatistics. Belmont, California: Wadsworth, Inc. 1993
(5) Kramer S. Clinical Epidemiology and Biostatistics. A primer for Clinical Investigators and Decision-makers. Berlin Heidelberg, German: Springer-Verlag. 1988
(6) Waterhouse J et al. (eds.). Cancer incidence in five continents. Lyon, France: IARC. 1976.
(7) Szklo M, Nieto J. Epidemiology, Beyond the basics. Gaithersburg, MD: Aspen Publishers, Inc. 2000
(8) Xunta de Galicia, Consellería de Sanidade e Servicios Sociais. Organización Panamericana de la Salud, Programa Especial de Análisis de Salud. Análisis Epidemiológico de Datos Tabulados (Epidat), Versión 2.1 [Programa informático para Windows]; 1998

Auteur: Preparé par le Groupe d'Analyse du Programme Spécial pour l'Analyse de la Santé (SHA) de l'OPS.



Retourner au contenu du Bulletin Epidémiologique, No. 3, Vol. 23 (Septembre 2002) en anglais ou en espagnol