tomado del Boletín
Epidemiológico, Vol. 25 No. 1, marzo 2004
Glosario de Análisis Multinivel - Parte III
Ana V. Diez RouxDivisiones de Medicina y de Epidemiología de la Universidad Columbia
Nueva York, Nueva York, Estados Unidos
Falta de independencia de las observaciones
Se trata de situaciones en las que variables dependientes correspondientes a observaciones a nivel inferior que forman parte de una unidad de nivel superior (o agrupación) están correlacionadas, incluso después de haber tenido en cuenta otras características medidas. Por ejemplo, una vez consideradas otras variables, individuales y del vecindario, puede haber una tendencia a que entre personas del mismo vecindario la tensión arterial sea más similar que entre personas de distintos vecindarios. En el caso de mediciones repetidas a lo largo del tiempo, dos mediciones de la tensión arterial en la misma persona pueden tender a estar más correlacionadas que dos mediciones efectuadas en personas diferentes, incluso una vez tenidas en cuenta las covariables pertinentes. Esta correlación puede deberse a la omisión en el modelo de variables importantes de nivel superior que son compartidas por las observaciones correspondientes a la misma unidad de nivel superior. Esta correlación residual infringe el supuesto de independencia de las observaciones, que es uno de los fundamentos de los modelos usuales de regresión. No tener en cuenta esta correlación puede hacer que se llegue a inferencias incorrectas, pero también puede reducir la eficiencia de la estimación40. Los modelos multinivel incorporan la posible correlación residual al permitir que las intersecciones y los coeficientes de regresión varíen aleatoriamente de grupo en grupo (por ejemplo, permitiendo errores de nivel macro, U0j y U1j en ecuaciones de segundo nivel; véase modelos multinivel).
Modelos de promedio poblacional
Son modelos que incorporan la correlación entre las unidades de nivel
inferior integradas en unidades de nivel superior (grupos, clases, etc.) modelando
las correlaciones o las covarianzas, en vez de permitir efectos o coeficientes
aleatorios como los modelos multinivel40, 46. Esas correlaciones se tienen
en cuenta al estimar cada coeficiente de regresión y su error estándar.
Pueden especificarse diferentes estructuras de correlación (que describen
correlaciones dentro del grupo o, en general, dentro de una unidad de nivel
superior). Los “modelos de promedio poblacional” también
se denominan “modelos marginales”40, 46 o “modelos de patrón
de covarianza”26. En los modelos multinivel la variable dependiente es
función de las covariables, condicional a los efectos (o coeficientes)
aleatorios. En cambio en los modelos de promedio poblacional se modela la expectativa
marginal de las variables dependientes en toda la población (de alguna
forma “promediada” sobre los efectos aleatorios). Por este motivo,
los modelos marginales también se han llamado modelos “de promedio
poblacional” (como forma de diferenciarlos de los modelos específicos
de individuo, o de efectos aleatorios)46. El método de la Ecuación
de Estimación Generalizada (o GEE del inglés Generalized Estimating
Equation) es uno de los métodos utilizados para estimar los modelos
marginales46.
En los modelos de promedio poblacional el promedio de la variable dependiente poblacional se modela en función de las covariables sin que se considere explícitamente la heterogeneidad entre unidades de nivel superior46. En cambio, en los modelos multinivel se investiga y se explica la fuente de variación intergrupal (y de correlación intragrupal), al modelar los coeficientes de regresión específicos de grupo en función de variables grupales y un componente aleatorio. Por consiguiente, aunque los modelos de promedio poblacional tienen en cuenta la correlación entre observaciones pertenecientes a una misma unidad de nivel superior, la fuente de esa correlación no se investiga directamente (la correlación y, a veces, los propios efectos de nivel superior, a menudo no son de interés directo). Tanto los modelos de promedio poblacional como los modelos multinivel permiten investigar los efectos de variables grupales e individuales sobre los resultados a nivel individual. Pero a diferencia de los modelos multinivel, los modelos de promedio poblacional no permiten examinar la variación intergrupal, las variables grupales o individuales relacionadas con ella o la magnitud de las varianzas intergrupal e intragrupal (véase componentes de la varianza). Las diferencias entre ambos tipos de modelos también tienen consecuencias para la interpretación de los coeficientes de regresión. En los modelos multinivel el coeficiente de regresión estima el efecto de las covariables condicional a los efectos (o coeficientes) aleatorios. En los modelos marginales el coeficiente expresa el cambio de respuesta en función de las covariables “promediado” con respecto a la heterogeneidad intergrupal (o con respecto a los efectos grupales aleatorios)40, 46. Si las variables dependientes son continuas, estos coeficientes son matemáticamente equivalentes, pero si se trata de variables no gausianas (por ejemplo, modelos logísticos) los valores del parámetro marginal generalmente serán menores en valor absoluto que sus análogos en un modelo de efectos aleatorios46, 47.
Falacia psicologista
Es la falacia que puede darse al no considerar las características grupales
cuando se infieren conclusiones referentes a las causas de variabilidad interindividual1,
2. . Dicho de otra forma, es la falacia que se produce al suponer que los resultados
individuales pueden explicarse exclusivamente a partir de las características
individuales. Aunque el nivel de recogida de datos (nivel individual) corresponda
al modelo conceptual que se estudia, quizá no se hayan tenido en cuenta
hechos importantes de otros niveles (nivel grupal)1, 2. Por ejemplo, en un
estudio basado en individuos quizá se observe que los inmigrantes tienen
mayor probabilidad de sufrir depresión que los nativos. Pero supongamos
que esto solo es cierto en el caso de inmigrantes que viven en comunidades
donde son una pequeña minoría. Un investigador que no tenga en
cuenta el efecto contextual de la composición de las comunidades quizá atribuya
la mayor tasa de depresión de los inmigrantes a los efectos psicológicos
de la inmigración o a factores genéticos, haciendo caso omiso
de los factores comunitarios e incurriendo así en una falacia psicologista1.
La expresión “falacia psicologista” no es demasiado buena,
porque los factores individuales con los que se explica el resultado a menudo
no son solo psicológicos2. El término falacia individualista
puede parecer más adecuado, pero también se ha empleado como
sinónimo de falacia atomista, que es una falacia relacionada con la
falacia individualista, pero es distinta3, 4. Véase también falacia
sociologista.
Modelos de coeficientes aleatorios
Término originalmente empleado para los modelos en los cuales los coeficientes
de regresión correspondientes a las covariables del modelo se modelan
como aleatorios en vez de fijos19, 26 (véase, por ejemplo, b1j en la
entrada modelos multinivel). Los modelos tradicionales de coeficientes aleatorios
no incluyen variable predictivas correspondientes al nivel superior (variables
grupales) en las ecuaciones correspondiente al nivel grupal (así, en
un modelo tradicional de coeficientes aleatorios, la ecuación (3) sería
b1j = ã10 + U1j)19. Por lo tanto los modelos de coeficientes aleatorios
pueden considerarse un caso particular de modelos multinivel. Sin embargo,
el término “modelos de coeficientes aleatorios” se usa a
veces en sentido más amplio para referirse al conjunto de los modelos
multinivel. Véanse también las entradas efectos aleatorios /
coeficientes aleatorios y modelos de efectos aleatorios.
Efectos aleatorios / coeficientes aleatorios
Son coeficientes de regresión (ya sea la intersección o el efecto
de una covariable) a los que se permite variar aleatoriamente entre unas y
otras unidades de nivel superior (es decir, se supone que son casos concretos
de valores de una distribución probabilística) (véase
modelos multinivel). Por ejemplo, en el caso de las personas consideradas en
sus vecindarios, puede suponerse que los efectos del vecindario varían
aleatoriamente en torno a una media general (efecto aleatorio, véase
modelos de efectos aleatorios). De modo similar, puede permitirse que el efecto
de la variable ingreso personal en la salud individual varíe aleatoriamente
de un vecindario a otro (coeficiente aleatorio, véase modelos de coeficiente
aleatorio). Entre los términos “efectos aleatorios” y “coeficientes
aleatorios” a veces se establecen diferencias, como ya se dijo, pero
a menudo se usan indistintamente. Los efectos (o coeficientes) aleatorios son
especialmente apropiados cuando las unidades de nivel superior (o grupos) pueden
considerarse muestras aleatorias de una población mayor de unidades
(o grupos) acerca de la cual se quieren hacer inferencias. Véase también
efectos fijos / coeficientes fijos.
Modelos de efectos aleatorios
Término originalmente empleado para los modelos en los cuales las diferencias
entre grupos (u otro sistema de clasificación) se consideran aleatorias
en lugar de fijas19, 26 (es decir, son modelos en los que hay efectos aleatorios).
Por ejemplo, si se trata de personas consideradas en sus vecindarios, un modelo
que considera fijas las diferencias entre vecindarios incluirá un conjunto
de variables indicadoras para representar a los vecindarios de la muestra en
una ecuación de regresión en la que las unidades de análisis
serán los individuos (véase coeficientes fijos). En cambio, un
modelo de efectos aleatorios tratará las diferencias entre vecindarios
como realizaciones de una distribución probabilística –es
decir, permitirá que las intersecciones correspondientes a cada vecindario
varíen aleatoriamente entre vecindarios según una distribución
probabilística (véase modelos multinivel). Se presupone que los
vecindarios del estudio son una muestra aleatoria de un universo de vecindarios
sobre el que se desea hacer inferencias. Los modelos de efectos aleatorios
pueden considerarse un caso particular de los modelos multinivel en el que
sólo a las intersecciones se les permite variar aleatoriamente entre
los grupos (es decir, son modelos de intersección aleatoria). A veces,
sin embargo, el término “modelos de efectos aleatorios” se
usa de modo más general para referirse al conjunto de los modelos multinivel
(es decir, modelos que permiten intersección aleatoria y efectos de
covarianza aleatorios). Véase también modelos de coeficientes
aleatorios.
Correlación residual
Véase falta de independencia de las observaciones
Falacia sociologista
Falacia inferencial que puede surgir al no considerar las características
individuales al hacer inferencias sobre las causas de la variabilidad intergrupal1,
2. Aunque el nivel de recogida de datos (nivel grupal) corresponda al modelo
conceptual que se estudia, quizá no se han tenido en cuenta datos importantes
correspondientes a otros niveles (nivel individual)1. Supongamos que un investigador
encuentra que las comunidades con mayores tasas de población transeúnte
presentan tasas más elevadas de esquizofrenia, y llega a la conclusión
de que una mayor proporción de población transeúnte genera
desorganización social, deterioro de las redes sociales y mayor riesgo
de esquizofrenia de todos los habitantes de la comunidad. Pero supongamos que
las tasas de esquizofrenia sólo aumentan entre los residentes transeúntes
(que suelen tener menos vínculos sociales, lo cual les hace correr mayor
riesgo de padecer esquizofrenia). Esto quiere decir que las tasas de esquizofrenia
son elevadas entre los transeúntes y bajas entre los no transeúntes,
independientemente de que vivan en comunidades con alta o baja proporción
de residentes transeúntes. Si es este el caso, el investigador está incurriendo
en una falacia sociologista, pues atribuye las mayores tasas de esquizofrenia
a la desorganización social que afecta a todos los miembros de la comunidad,
y no a las diferencias de proporción de transeúntes entre unas
comunidades y otras. Véase también falacia psicologista.
Variables estructurales
Son un tipo de variables grupales referentes a relaciones o interacciones entre
los miembros de un grupo13; por ejemplo, las características de las
redes sociales dentro del grupo o los patrones de contactos o interacciones
entre los miembros del grupo. Las variables estructurales a veces se consideran
un subtipo de variables integrales12, 18.
Modelos específicos
de individuo o de sujeto
Término empleado para referirse a los modelos de efectos aleatorios
o de coeficientes aleatorios (o a los modelos multinivel en general) para diferenciarlos
de los modelos de promedio poblacional. Se usó “específicos
de individuo” o “específicos de sujeto” porque estos
términos surgieron en el contexto del análisis longitudinal de
datos46, donde los individuos o sujetos son las unidades de nivel superior
y las mediciones repetidas son las unidades de nivel inferior. En este caso,
los coeficientes fijos derivados de un modelo multinivel son condicionales
a la presencia de componentes aleatorios correspondientes al individuo o sujeto
(específicos de la persona). De ahí la denominación “específicos
de individuo” o “de sujeto”. Más propiamente los modelos
multinivel deberían denominarse “modelos específicos de
unidad de nivel superior” (en lugar de “específicos de individuo” o “de
sujeto”) ya que todos sus coeficientes fijos se estiman condicionales
a (o suponiendo la presencia de) componentes aleatorios a nivel superior. Por
ejemplo, en la entrada modelos multinivel, ã01 se estima suponiendo
la presencia de efectos aleatorios grupales (como reflejan los términos
U0j y U1j).
Componentes de la varianza
Mediante un modelo multinivel, la variación total de resultados de nivel
individual (o, más en general, resultados de nivel inferior) puede descomponerse
en una varianza intragrupal y otra intergrupal (o, más en general, de
unidades de nivel superior). Por ejemplo, la varianza individual de la tensión
arterial puede descomponerse en una varianza dentro de cada vecindario y otra
entre vecindarios. Estos componentes se denominan componentes de la varianza.
La posibilidad de estimar los componentes de la varianza (que proporcionan
información importante sobre la variabilidad de los resultados en cada
grupo y entre grupos) es una característica clave de los modelos multinivel,
que los distingue de los modelos de efectos contextuales tradicionales y de
los modelos de promedio poblacional. Por ello los modelos multinivel se llaman
a veces “modelos de componentes de la varianza” o “modelos
de componentes de la covarianza”. Véase también modelos
multinivel.
Referencias:
NOTA: Las referencias 1-38 se incluyeron en las partes I y II del Glosario
en Vol. 24, No. 3 (2003) y Vol. 24, No. 4 (2003) del Boletín Epidemiológico.
(39) Wong G, Mason W. The hierarchical logistic regression model for multilevel
analysis. J Am Stat Assoc 1985;80:513–24.
(40) Diggle PJ, Liang KY, Zeger SL. Analysis of longitudinal data. New York:Oxford
University Press, 1994.
(41) Laird NM, Ware H. Random effects models for longitudinal data. Biometrics
1982;38:963–74.
(42) Longford NT. Random coefficient models. Oxford: Clarendon, 1982.
(43) Dempster AP, Rubin DB, Tsutakawa RK. Estimation in covariance components
models. J Am Stat Assoc 1981;76:341–56.
(44) Searle SR, Casella G, McCullogh CE. Variance components. New York: Wiley,
1992.
(45) Morris C, Christiansen C. Fitting Weibull duration models with random
effects. Lifetime Data Anal1995;1:347–59.
(46) Zeger S, Liang K, Albert P. Models for longitudinal data: a generalized
estimating equation approach. Biometrics 1988;44:1049–60.
(47) Burton P, Gurrin L, Sly P. Extending the simple linear regression model
for correlated responses: an introduction to generalized estimating equations
and multi-level mixed modeling. Stat Med1998;17:1261–91.
Regresar al temario de el
Boletín Epidemiológico,
Vol. 25 No. 1, marzo 2004
