extrait du Bulletin Epidémiologique de l'OPS. Edition complète du No. 3, Vol. 23 (Septembre 2002) disponible en anglais et en espagnol
La Standardisation: Une Méthode Épidémiologique Classique
pour la Comparaison des Taux
Introduction
L'un des principes de base de l'analyse de la situation sanitaire (ASIS) est
la comparaison d'indicateurs de santé. Elle permet entre autre d'identifier
des secteurs à risque, de définir des besoins et de documenter
les inégalités de santé qui existent entre deux populations
ou plus, entre les sous-groupes d'une même population, ou bien à
différents moments dans une même population. Qu'ils représentent
la mortalité, la morbidité ou d'autres événements
de santé, les taux bruts sont des mesures qui résument la santé
des populations et facilitent cette analyse comparative. La comparaison de taux
bruts peut cependant parfois être inadéquate, en particulier lorsque
les structures d'âge, par sexe ou niveau socio-économique des population
ne sont pas comparables. En effet, ces facteurs et d'autres encore influencent
le niveau des taux bruts et peuvent déformer leur interprétation,
par un effet que l'on appelle de confusion (figure 1).(1, 2, 3)
|
Figure 1: Définition de l'effet de confusion
|
|
Un effet de confusion apparaît quand la mesure de l'effet d'une exposition sur un risque est déformée par la relation entre l'exposition et d'autres facteurs qui influencent également le résultat étudié. (1) Un facteur de confusion doit remplir trois critères : 1) être un facteur de risque connu pour le résultat étudié (2), 2) être un facteur associé à l'exposition mais pas un résultat de l'exposition (2), et 3) être un facteur qui n'est pas une variable intermédiaire entre eux. Un exemple de confusion est celui du tabagisme comme facteur confondant
dans l'étude de la consommation de café comme facteur
de risque de la maladie cardiovasculaire ischémique. L'association
entre la consommation de café et la maladie cardiovasculaire
ischémique peut être distortionnée par le tabagisme.
En effet, le tabagisme est un facteur de risque connu pour la cardiopathie
ischémique. Il est associé à la consommation de
café, car les fumeurs sont d'habitude des consommateurs de café,
mais ce n'est pas un résultat de la consommation de café.
Le tabagisme n'est pas une variable intermédiaire entre la consommation
de café et la maladie cardiovasculaire ischémique.
Le tabagisme est un facteur de confusion de l'association entre la consommation de café et la maladie cardiovasculaire ischémique. Sources: |
Le calcul de taux spécifiques dans des sous-groupes de
population bien définis est une façon d'éviter certains
facteurs de confusion. L'on utilise par exemple souvent les taux spécifiques
à des tranches d'âge pour examiner comment les maladies affectent
les populations différemment selon leur âge. Cependant, même
si cela permet d'en savoir plus sur les modèles de répartition
des problèmes de santé dans la population, tout en permettant
une comparaison plus rigoureuse des taux, il peut parfois être peu pratique
de travailler avec un grand nombre de sous-groupes.(4) En outre, si les sous-groupes
sont constitués de populations de petites tailles, les taux spécifiques
peuvent être très imprécis. Le processus de standardisation
(ou d'ajustement) des taux est une méthode épidémiologique
classique qui enlève l'effet de confusion des variables dont l'on sait
- ou pense - qu'elles diffèrent dans les populations que l'on veut comparer.
Il fournit une mesure résumée facile à utiliser, qui peut
être utile pour les utilisateurs de l'information, tels que les gestionnaires
de la santé, qui préfèrent souvent avoir une image synthétique
de l'état de santé de la population.
Dans la pratique, l'âge est un facteur d'ajustement fréquent. La
standardisation selon l'âge est souvent utilisée dans les études
comparatives de mortalité, car la structure d'âge a un impact important
sur la mortalité totale d'une population. Par exemple, dans des situations
avec des niveaux de mortalité totale modérée, comme la
plupart des pays des Amériques, une structure de population plus vieille
présentera toujours des taux bruts plus élevés qu'une population
plus jeune.
Il existe deux méthodes principales de standardisation, qui dépendent du standard utilisé : soit la distribution d'une population (méthode directe), soit un ensemble de taux spécifiques (méthode indirecte). Les deux méthodes sont présentées ci-dessous.
Méthode directe
Dans la méthode de standardisation directe, l'on calcule les taux que
l'on s'attendrait à trouver dans les populations étudiées
si elles avaient toutes la même composition selon la variable que nous
voulons ajuster ou contrôler (comme par exemple l'âge, le groupe
socio-économique, ou d'autres caractéristiques). L'on utilise
la structure d'une population appelée "standard", stratifiée
selon la variable que l'on veut contrôler, et à laquelle l'on applique
les taux spécifiques des strates correspondantes dans la population étudiée.
L'on obtient ainsi le nombre de cas "attendus" dans chaque strate
si les populations avaient la même composition. Le taux ajusté
ou "standardisé" est obtenu en divisant le total de cas attendus
par la population standard. Un exemple est présenté à la
figure 2.
Le choix de la population-type représente une étape importante de la standardisation directe.(3) La valeur du taux ajusté dépend de la population-type utilisée, mais cette population peut être choisie de manière relativement arbitraire, car la valeur calculée n'a pas de signification particulière en elle-même. En effet, les taux ajustés sont le produit d'un calcul hypothétique et ne représentent pas les valeurs exactes des taux. Ils ne servent qu'à titre de comparaison entre des groupes, et non comme une mesure de magnitude abolue.(3) Certains aspects doivent cependant être pris en compte dans le choix de la population-type. La population-type peut provenir des populations étudiées (somme ou moyenne, par exemple). Dans ce cas cependant, il est important de s'assurer que les populations ne sont pas de taille très différentes, puisqu'une population de plus grande taille peut avoir une influence excessive sur les taux.(5) La population standard-type peut aussi provenir d'une population sans aucune relation avec les données étudiées, mais en général, sa distribution en ce qui concerne le facteur d'ajustement ne doit pas différer radicalement des populations à comparer.
L'étude comparative de taux ajustés peut être réalisée de diverses façons : l'on peut calculer la différence absolue entre les taux, leur proportion, ou le pourcentage de différence entre eux. Cette comparaison n'est évidemment valable que lorsque le même standard a été utilisé pour calculer les taux ajustés. Lorsque les standards nationaux changent (comme aux Etats-Unis en 1999 par exemple, lorsqu'un nouveau standard basé sur la population américaine de l'an 2000 a été adopté, au lieu de la norme de 1940), les séries doivent être recalculées à tous les niveaux. La mise à jour des populations-type fournit une norme commune plus actuelle. Pour la comparaison de taux de pays différents, la population standard utilisée par l'OMS et l'OPS est celle définie par Waterhouse.(6) La répartition en fonction de l'âge de cette population est présentée à la figure 3.
La méthode directe est la plus fréquemment utilisée. Cependant, elle requière des taux spécifiques correspondant aux strates de la variable d'intérêt dans toutes les populations que l'on veut comparer. Ces taux ne sont pas toujours disponibles. Même lorsqu'ils le sont pour tous les sous-groupes, ils sont parfois calculés sur de très petits nombres et peuvent donc être très imprécis. Dans ce cas, l'on recommande la standardisation indirecte.(3)
|
Figure 2: Comparaison des taux de mortalité
générale standardisés pour l'âge au Mexique
et aux Etats-Unis, 1995-1997, méthode directe
|
|||||
|
Dans cet exemple, pour utiliser la méthode directe il faut disposer
des éléments suivants: L'on calcule tout d'abord le nombre attendu de décès dans les deux pays, en appliquant le taux de chaque pays à la population standard (colonnes (4) et (5)). La somme de tous les groupes nous donne le total de décès attendu. Pour calculer le taux ajusté, l'on divise ce total par la population standard totale. Dans ce cas, l'on obtient un taux de 6.4 pour 1,000 habitants au Mexique et 5.7 pour 1,000 habitants aux Etats-Unis. |
|||||
|
Taux de mortalité spécifique
par groupe d'âge pour 100 000 habitants, 1995-1997
|
Nombre de décès
attendu
|
||||
|
Population standard
(1) |
Mexique
(2) |
Etats-Unis
(3) |
Mexique (4)=(1)x(2)/100 000
|
Etats-Unis
(5)=(1)x(3)/100 000 |
|
| <1 | 2 400 |
1693,2
|
737,8
|
41
|
18
|
| 1-4 | 9 600 |
112,5
|
38,5
|
11
|
4
|
| 5-14 | 19 000 |
36,2
|
21,7
|
7
|
4
|
| 15-24 | 17 000 |
102,9
|
90,3
|
17
|
15
|
| 25-44 | 26 000 |
209,6
|
176,4
|
55
|
46
|
| 45-64 | 19 000 |
841,1
|
702,3
|
160
|
133
|
| 65+ | 7 000 |
4 967,4
|
5 062,6
|
348
|
354
|
| 100 000 |
639
|
574
|
|||
|
Taux de mortalité ajusté pour l'âge (Mexique)
= 6,4 pour 1 000 hab. En éliminant l'effet de la différence de la structure
de l'âge dans les deux pays, l'on obtient un taux plus élevé
au Mexique qu'aux Etats-Unis. La conclusion de la comparaison des taux
est inversée si l'on utilise des taux ajustés plutôt
que des taux bruts.
|
|||||
|
Source des données: Pan American Health Organization. Perfiles
de mortalidad de las comunidades hermanas fronterizas México -
Estados Unidos Edición 2000 / Mortality profiles of the Sister
Communities on the United States-Mexico border 2000 Edition. Washington,
D.C.: OPS. 2000 |
|||||
|
Figure 3: Populations-type de Waterhouse
(mondiale et européenne) |
||
|
Groupe d'âge (années)
|
Mondiale
|
Européenne
|
|
0
|
2 400
|
1 600
|
|
1-4
|
9 600
|
6 400
|
|
5-9
|
10 000
|
7 000
|
|
10-14
|
9 000
|
7 000
|
|
15-19
|
9 000
|
7 000
|
|
20-24
|
8 000
|
7 000
|
|
25-29
|
8 000
|
7 .000
|
|
30-34
|
6 000
|
7 000
|
|
35-39
|
6 000
|
7 000
|
|
40-44
|
6 000
|
7 000
|
|
45-49
|
6 000
|
7 000
|
|
50-54
|
5 000
|
7 000
|
|
55-59
|
4 000
|
6 000
|
|
60-64
|
4 000
|
5 000
|
|
65-69
|
3 000
|
4 000
|
|
70-74
|
2 000
|
3 000
|
|
75-79
|
1 000
|
2 000
|
|
80-84
|
500
|
1 000
|
|
85+
|
500
|
1 000
|
| Total |
100 000
|
100 000
|
| Source: Waterhouse J. and Col. (Eds.). Cancer incidence in five continents. Lyon, IARC, 1976. | ||
Méthode indirecte
La standardisation indirecte diffère dans la méthode et dans son
interprétation. Un exemple d'ajustement utilisant la méthode indirecte
est présenté à la figure 4. Au lieu d'utiliser la structure
de la population-type, l'on utilise ses taux spécifiques et on les applique
aux populations à comparer, que l'on a tout d'abord stratifiées
selon la variable à contrôler. De cette façon, l'on obtient
le total de cas attendus. Le Rapport de Mortalités Standardisées
(RMS) est alors calculé en divisant le total de cas observés par
le total de cas attendus. Ce rapport permet de comparer chaque population à
la population standard. L'on peut aboutir à une conclusion en calculant
et en examinant le RMS. Un RMS plus élevé que 1 (ou que 100, si
on l'exprime en pourcentage), indique que le risque de mourir dans la population
observée est plus élevé que ce à quoi l'on s'attendrait
si elle était exposée au même risque que la population standard.
D'autre part, un RMS plus petit que 1 (ou 100) indique que le risque de mourir
est inférieur dans la population observée que ce à quoi
l'on s'attendrait dans la population de référence. Les taux ajustés
peuvent aussi être calculés par la méthode indirecte en
multipliant le taux brut de chaque population par son RMS.(4) Comme dans le
cas de la méthode directe, une valeur simple est obtenue pour chaque
population qui, bien qu'elle représente seulement un nombre artificiel,
tient compte des différences de composition des populations.
Le Rapport de Mortalités (ou Morbidités) Standardisées est fréquemment utilisé en épidémiologie pour comparer différents groupes, parce qu'il est faciles à calculer, mais également parce qu'il donne une idée du risque relatif entre la population standard et la population étudiée. Cependant, il est important de savoir qu'il existe des situations dans lesquelles cette comparaison n'est pas adéquate, comme par exemple lorsque les rapports des taux dans les groupes étudiés et dans la population de référence ne sont pas homogènes dans les différentes strates.(7) Cependant, la comparaison entre chaque groupe et la population de référence est toujours appropriée. Le RMS de causes différentes dans une population peut aussi être calculé, en utilisant le même standard.
|
Figure 4: Utilisation de la méthode indirecte
de standardisation pour comparer la mortalité dans l'état
colombien de Vichada et en Colombie en général, 1999
|
|||||
|
Dans ce cas, pour utiliser la méthode indirecte nous avons besoin
des éléments suivants: La première étape consiste à calculer le nombre
attendu de décès à Vichada en appliquant les taux
standards à la population du département (colonne (3) =
(1) x (2)). Ensuite, les décès calculées sont additionnés
et le RMS est calculé en divisant le nombre total de décès
observés par les décès attendus.
|
|||||
|
Taux de mortalité spécifiques par groupe d'âge, Colombie, 1999 (i) (1) |
Population du département de Vichada (i) (2) |
Décès observés à Vichada (3) |
Décès attendus
à Vichada, 1999 (i)
|
||
|
0-4
|
339
|
11 392
|
61
|
39
|
|
|
5-14
|
34
|
21 930
|
5
|
7
|
|
|
15-44
|
219
|
38 244
|
27
|
84
|
|
|
45-64
|
752
|
7 083
|
22
|
53
|
|
|
65 +
|
4.573
|
1 839
|
27
|
84
|
|
|
80 488
|
142
|
267
|
|||
|
La valeur du RMS montre que le risque de mourir à Vichada est 47% moins élevé que ce que l'on espérerait en fonction des standards de mortalité dans toute la Colombie, en contrôlant la variable âge.
|
|||||
|
Source des données: |
|||||
|
NOTE : intervalle de confiance pour le RMS L'intervalle de confiance fournit l'étendue des valeurs dans lesquelles nous nous attendons à trouver la valeur réelle de l'indicateur étudié, avec une probabilité donnée. De cette façon, il donne une estimation de la différence potentielle entre ce qui est observé et ce qui arrive vraiment dans la population, ce qui aide dans l'interprétation de la valeur de l'indicateur observé. L'intervalle de confiance de 95 % est le plus utilisé. Comme indiqué précédemment, il présente la gamme de valeurs dans laquelle l'on s'attend à trouver la valeur réelle de l'indicateur, avec une probabilité de 95 %. Dans le cas du RMS, le calcul de l'intervalle de confiance peut être
effectué de façon suivante : 2) L'Intervalle de Confiance de 95 % (IC) est ensuite calculé
comme suit : |
|
Dans cet exemple, l'ET pour Vichada este de 4,4 et le CI (95%) = [44,4
; 51,6]
|
Conclusion
Comme avec n'importe quelle mesure résumée, les taux ajustés
peuvent cacher de grandes différences entre des groupes, qui peuvent
avoir de l'importance pour expliquer des changements dans les taux dus à
ou associés à la variable à ajuster, par exemple. Néanmoins,
il est important d'analyser les taux spécifiques avec les taux ajustés,
dans la mesure du possible. Lorsqu'elles sont utilisées dans une même
population, les deux méthodes doivent conduire aux mêmes conclusions.
Si cela n'est pas le cas, il existe un facteur dans les différentes strates
de la population qui exige une recherche plus approfondie.(4)
Une des raisons de l'utilisation parfois limitée de ces méthodes est le manque d'outils ou d'instruments qui les simplifient. Pour répondre à ce besoin, la Direction Générale de Santé publique de la Xunta de Galice et le Programme Spécial pour l'Analyse de la Santé de l'OPS ont développé le programme informatique "EpiDat" pour l'analyse de données tabulées. EpiDat est distribué gratuitement via Internet à l'adresse suivante: http://www.paho.org/Spanish/SHA/epidat.htm. Une version plus récente de ce programme sera publiée bientôt. Le logiciel SIGEpi (voir le document en anglais: http://www.paho.org/English/sha/be_v22n3-SIGEpi.htm), qui rassemble des capacités de système d'information géographiques avec des outils épidémiologiques, permet également de calculer des taux ajustés.
En bref, les taux ajustés permettent des comparaisons plus exactes entre des populations. Cela est important parce qu'ils peuvent conduire à la mise en place de priorités entre des groupes. Néanmoins, les taux bruts sont les seuls indicateurs de la dimension réelle ou de l'ampleur d'un problème, et conservent donc toute leur valeur comme outil de la santé publique.
Références:
(1) Last J. A Dictionary of Epidemiology, Fourth Edition. New York, New York:
Oxford University Press. 2001
(2) Jenicek M, Cléroux R. Epidemiología: Principios, Técnicas
y Aplicaciones. Barcelona, España: Salvat Editores. 1987
(3) Gordis L. Epidemiology. Philadelphia, PA: W.B. Saunders Company. 1996
(4) Pagano M, Gauvreau K. Principles of Biostatistics. Belmont, California:
Wadsworth, Inc. 1993
(5) Kramer S. Clinical Epidemiology and Biostatistics. A primer for Clinical
Investigators and Decision-makers. Berlin Heidelberg, German: Springer-Verlag.
1988
(6) Waterhouse J et al. (eds.). Cancer incidence in five continents. Lyon, France:
IARC. 1976.
(7) Szklo M, Nieto J. Epidemiology, Beyond the basics. Gaithersburg, MD: Aspen
Publishers, Inc. 2000
(8) Xunta de Galicia, Consellería de Sanidade e Servicios Sociais. Organización
Panamericana de la Salud, Programa Especial de Análisis de Salud. Análisis
Epidemiológico de Datos Tabulados (Epidat), Versión 2.1 [Programa
informático para Windows]; 1998
Auteur: Preparé par le Groupe d'Analyse du Programme Spécial pour l'Analyse de la Santé (SHA) de l'OPS.
Retourner au contenu du Bulletin Epidémiologique,
No. 3, Vol. 23 (Septembre 2002) en anglais
ou en espagnol
