Organización Panamericana de la Salud
Promoviendo la salud en las Américas

Hospitales Seguros
Acerca de la OPS - Cuerpos Directivos  - Directora de la OPS  - Oficinas de Representantes en los Países & Centros  - Organización Mundial de la Salud

—tomado del Boletín Epidemiológico, Vol. 25 No. 1, marzo 2004

Glosario de Análisis Multinivel - Parte III

Ana V. Diez Roux
Divisiones de Medicina y de Epidemiología de la Universidad Columbia
Nueva York, Nueva York, Estados Unidos


Falta de independencia de las observaciones
Se trata de situaciones en las que variables dependientes correspondientes a observaciones a nivel inferior que forman parte de una unidad de nivel superior (o agrupación) están correlacionadas, incluso después de haber tenido en cuenta otras características medidas. Por ejemplo, una vez consideradas otras variables, individuales y del vecindario, puede haber una tendencia a que entre personas del mismo vecindario la tensión arterial sea más similar que entre personas de distintos vecindarios. En el caso de mediciones repetidas a lo largo del tiempo, dos mediciones de la tensión arterial en la misma persona pueden tender a estar más correlacionadas que dos mediciones efectuadas en personas diferentes, incluso una vez tenidas en cuenta las covariables pertinentes. Esta correlación puede deberse a la omisión en el modelo de variables importantes de nivel superior que son compartidas por las observaciones correspondientes a la misma unidad de nivel superior. Esta correlación residual infringe el supuesto de independencia de las observaciones, que es uno de los fundamentos de los modelos usuales de regresión. No tener en cuenta esta correlación puede hacer que se llegue a inferencias incorrectas, pero también puede reducir la eficiencia de la estimación40. Los modelos multinivel incorporan la posible correlación residual al permitir que las intersecciones y los coeficientes de regresión varíen aleatoriamente de grupo en grupo (por ejemplo, permitiendo errores de nivel macro, U0j y U1j en ecuaciones de segundo nivel; véase modelos multinivel).

Modelos de promedio poblacional
Son modelos que incorporan la correlación entre las unidades de nivel inferior integradas en unidades de nivel superior (grupos, clases, etc.) modelando las correlaciones o las covarianzas, en vez de permitir efectos o coeficientes aleatorios como los modelos multinivel40, 46. Esas correlaciones se tienen en cuenta al estimar cada coeficiente de regresión y su error estándar. Pueden especificarse diferentes estructuras de correlación (que describen correlaciones dentro del grupo o, en general, dentro de una unidad de nivel superior). Los “modelos de promedio poblacional” también se denominan “modelos marginales”40, 46 o “modelos de patrón de covarianza”26. En los modelos multinivel la variable dependiente es función de las covariables, condicional a los efectos (o coeficientes) aleatorios. En cambio en los modelos de promedio poblacional se modela la expectativa marginal de las variables dependientes en toda la población (de alguna forma “promediada” sobre los efectos aleatorios). Por este motivo, los modelos marginales también se han llamado modelos “de promedio poblacional” (como forma de diferenciarlos de los modelos específicos de individuo, o de efectos aleatorios)46. El método de la Ecuación de Estimación Generalizada (o GEE del inglés Generalized Estimating Equation) es uno de los métodos utilizados para estimar los modelos marginales46.

En los modelos de promedio poblacional el promedio de la variable dependiente poblacional se modela en función de las covariables sin que se considere explícitamente la heterogeneidad entre unidades de nivel superior46. En cambio, en los modelos multinivel se investiga y se explica la fuente de variación intergrupal (y de correlación intragrupal), al modelar los coeficientes de regresión específicos de grupo en función de variables grupales y un componente aleatorio. Por consiguiente, aunque los modelos de promedio poblacional tienen en cuenta la correlación entre observaciones pertenecientes a una misma unidad de nivel superior, la fuente de esa correlación no se investiga directamente (la correlación y, a veces, los propios efectos de nivel superior, a menudo no son de interés directo). Tanto los modelos de promedio poblacional como los modelos multinivel permiten investigar los efectos de variables grupales e individuales sobre los resultados a nivel individual. Pero a diferencia de los modelos multinivel, los modelos de promedio poblacional no permiten examinar la variación intergrupal, las variables grupales o individuales relacionadas con ella o la magnitud de las varianzas intergrupal e intragrupal (véase componentes de la varianza). Las diferencias entre ambos tipos de modelos también tienen consecuencias para la interpretación de los coeficientes de regresión. En los modelos multinivel el coeficiente de regresión estima el efecto de las covariables condicional a los efectos (o coeficientes) aleatorios. En los modelos marginales el coeficiente expresa el cambio de respuesta en función de las covariables “promediado” con respecto a la heterogeneidad intergrupal (o con respecto a los efectos grupales aleatorios)40, 46. Si las variables dependientes son continuas, estos coeficientes son matemáticamente equivalentes, pero si se trata de variables no gausianas (por ejemplo, modelos logísticos) los valores del parámetro marginal generalmente serán menores en valor absoluto que sus análogos en un modelo de efectos aleatorios46, 47.

Falacia psicologista
Es la falacia que puede darse al no considerar las características grupales cuando se infieren conclusiones referentes a las causas de variabilidad interindividual1, 2. . Dicho de otra forma, es la falacia que se produce al suponer que los resultados individuales pueden explicarse exclusivamente a partir de las características individuales. Aunque el nivel de recogida de datos (nivel individual) corresponda al modelo conceptual que se estudia, quizá no se hayan tenido en cuenta hechos importantes de otros niveles (nivel grupal)1, 2. Por ejemplo, en un estudio basado en individuos quizá se observe que los inmigrantes tienen mayor probabilidad de sufrir depresión que los nativos. Pero supongamos que esto solo es cierto en el caso de inmigrantes que viven en comunidades donde son una pequeña minoría. Un investigador que no tenga en cuenta el efecto contextual de la composición de las comunidades quizá atribuya la mayor tasa de depresión de los inmigrantes a los efectos psicológicos de la inmigración o a factores genéticos, haciendo caso omiso de los factores comunitarios e incurriendo así en una falacia psicologista1. La expresión “falacia psicologista” no es demasiado buena, porque los factores individuales con los que se explica el resultado a menudo no son solo psicológicos2. El término falacia individualista puede parecer más adecuado, pero también se ha empleado como sinónimo de falacia atomista, que es una falacia relacionada con la falacia individualista, pero es distinta3, 4. Véase también falacia sociologista.

Modelos de coeficientes aleatorios
Término originalmente empleado para los modelos en los cuales los coeficientes de regresión correspondientes a las covariables del modelo se modelan como aleatorios en vez de fijos19, 26 (véase, por ejemplo, b1j en la entrada modelos multinivel). Los modelos tradicionales de coeficientes aleatorios no incluyen variable predictivas correspondientes al nivel superior (variables grupales) en las ecuaciones correspondiente al nivel grupal (así, en un modelo tradicional de coeficientes aleatorios, la ecuación (3) sería b1j = ã10 + U1j)19. Por lo tanto los modelos de coeficientes aleatorios pueden considerarse un caso particular de modelos multinivel. Sin embargo, el término “modelos de coeficientes aleatorios” se usa a veces en sentido más amplio para referirse al conjunto de los modelos multinivel. Véanse también las entradas efectos aleatorios / coeficientes aleatorios y modelos de efectos aleatorios.

Efectos aleatorios / coeficientes aleatorios
Son coeficientes de regresión (ya sea la intersección o el efecto de una covariable) a los que se permite variar aleatoriamente entre unas y otras unidades de nivel superior (es decir, se supone que son casos concretos de valores de una distribución probabilística) (véase modelos multinivel). Por ejemplo, en el caso de las personas consideradas en sus vecindarios, puede suponerse que los efectos del vecindario varían aleatoriamente en torno a una media general (efecto aleatorio, véase modelos de efectos aleatorios). De modo similar, puede permitirse que el efecto de la variable ingreso personal en la salud individual varíe aleatoriamente de un vecindario a otro (coeficiente aleatorio, véase modelos de coeficiente aleatorio). Entre los términos “efectos aleatorios” y “coeficientes aleatorios” a veces se establecen diferencias, como ya se dijo, pero a menudo se usan indistintamente. Los efectos (o coeficientes) aleatorios son especialmente apropiados cuando las unidades de nivel superior (o grupos) pueden considerarse muestras aleatorias de una población mayor de unidades (o grupos) acerca de la cual se quieren hacer inferencias. Véase también efectos fijos / coeficientes fijos.

Modelos de efectos aleatorios
Término originalmente empleado para los modelos en los cuales las diferencias entre grupos (u otro sistema de clasificación) se consideran aleatorias en lugar de fijas19, 26 (es decir, son modelos en los que hay efectos aleatorios). Por ejemplo, si se trata de personas consideradas en sus vecindarios, un modelo que considera fijas las diferencias entre vecindarios incluirá un conjunto de variables indicadoras para representar a los vecindarios de la muestra en una ecuación de regresión en la que las unidades de análisis serán los individuos (véase coeficientes fijos). En cambio, un modelo de efectos aleatorios tratará las diferencias entre vecindarios como realizaciones de una distribución probabilística –es decir, permitirá que las intersecciones correspondientes a cada vecindario varíen aleatoriamente entre vecindarios según una distribución probabilística (véase modelos multinivel). Se presupone que los vecindarios del estudio son una muestra aleatoria de un universo de vecindarios sobre el que se desea hacer inferencias. Los modelos de efectos aleatorios pueden considerarse un caso particular de los modelos multinivel en el que sólo a las intersecciones se les permite variar aleatoriamente entre los grupos (es decir, son modelos de intersección aleatoria). A veces, sin embargo, el término “modelos de efectos aleatorios” se usa de modo más general para referirse al conjunto de los modelos multinivel (es decir, modelos que permiten intersección aleatoria y efectos de covarianza aleatorios). Véase también modelos de coeficientes aleatorios.

Correlación residual
Véase falta de independencia de las observaciones

Falacia sociologista
Falacia inferencial que puede surgir al no considerar las características individuales al hacer inferencias sobre las causas de la variabilidad intergrupal1, 2. Aunque el nivel de recogida de datos (nivel grupal) corresponda al modelo conceptual que se estudia, quizá no se han tenido en cuenta datos importantes correspondientes a otros niveles (nivel individual)1. Supongamos que un investigador encuentra que las comunidades con mayores tasas de población transeúnte presentan tasas más elevadas de esquizofrenia, y llega a la conclusión de que una mayor proporción de población transeúnte genera desorganización social, deterioro de las redes sociales y mayor riesgo de esquizofrenia de todos los habitantes de la comunidad. Pero supongamos que las tasas de esquizofrenia sólo aumentan entre los residentes transeúntes (que suelen tener menos vínculos sociales, lo cual les hace correr mayor riesgo de padecer esquizofrenia). Esto quiere decir que las tasas de esquizofrenia son elevadas entre los transeúntes y bajas entre los no transeúntes, independientemente de que vivan en comunidades con alta o baja proporción de residentes transeúntes. Si es este el caso, el investigador está incurriendo en una falacia sociologista, pues atribuye las mayores tasas de esquizofrenia a la desorganización social que afecta a todos los miembros de la comunidad, y no a las diferencias de proporción de transeúntes entre unas comunidades y otras. Véase también falacia psicologista.

Variables estructurales
Son un tipo de variables grupales referentes a relaciones o interacciones entre los miembros de un grupo13; por ejemplo, las características de las redes sociales dentro del grupo o los patrones de contactos o interacciones entre los miembros del grupo. Las variables estructurales a veces se consideran un subtipo de variables integrales12, 18.

Modelos específicos de individuo o de sujeto
Término empleado para referirse a los modelos de efectos aleatorios o de coeficientes aleatorios (o a los modelos multinivel en general) para diferenciarlos de los modelos de promedio poblacional. Se usó “específicos de individuo” o “específicos de sujeto” porque estos términos surgieron en el contexto del análisis longitudinal de datos46, donde los individuos o sujetos son las unidades de nivel superior y las mediciones repetidas son las unidades de nivel inferior. En este caso, los coeficientes fijos derivados de un modelo multinivel son condicionales a la presencia de componentes aleatorios correspondientes al individuo o sujeto (específicos de la persona). De ahí la denominación “específicos de individuo” o “de sujeto”. Más propiamente los modelos multinivel deberían denominarse “modelos específicos de unidad de nivel superior” (en lugar de “específicos de individuo” o “de sujeto”) ya que todos sus coeficientes fijos se estiman condicionales a (o suponiendo la presencia de) componentes aleatorios a nivel superior. Por ejemplo, en la entrada modelos multinivel, ã01 se estima suponiendo la presencia de efectos aleatorios grupales (como reflejan los términos U0j y U1j).

Componentes de la varianza
Mediante un modelo multinivel, la variación total de resultados de nivel individual (o, más en general, resultados de nivel inferior) puede descomponerse en una varianza intragrupal y otra intergrupal (o, más en general, de unidades de nivel superior). Por ejemplo, la varianza individual de la tensión arterial puede descomponerse en una varianza dentro de cada vecindario y otra entre vecindarios. Estos componentes se denominan componentes de la varianza. La posibilidad de estimar los componentes de la varianza (que proporcionan información importante sobre la variabilidad de los resultados en cada grupo y entre grupos) es una característica clave de los modelos multinivel, que los distingue de los modelos de efectos contextuales tradicionales y de los modelos de promedio poblacional. Por ello los modelos multinivel se llaman a veces “modelos de componentes de la varianza” o “modelos de componentes de la covarianza”. Véase también modelos multinivel.

Referencias:
NOTA: Las referencias 1-38 se incluyeron en las partes I y II del Glosario en Vol. 24, No. 3 (2003) y Vol. 24, No. 4 (2003) del Boletín Epidemiológico.
(39) Wong G, Mason W. The hierarchical logistic regression model for multilevel analysis. J Am Stat Assoc 1985;80:513–24.
(40) Diggle PJ, Liang KY, Zeger SL. Analysis of longitudinal data. New York:Oxford University Press, 1994.
(41) Laird NM, Ware H. Random effects models for longitudinal data. Biometrics 1982;38:963–74.
(42) Longford NT. Random coefficient models. Oxford: Clarendon, 1982.
(43) Dempster AP, Rubin DB, Tsutakawa RK. Estimation in covariance components models. J Am Stat Assoc 1981;76:341–56.
(44) Searle SR, Casella G, McCullogh CE. Variance components. New York: Wiley, 1992.
(45) Morris C, Christiansen C. Fitting Weibull duration models with random effects. Lifetime Data Anal1995;1:347–59.
(46) Zeger S, Liang K, Albert P. Models for longitudinal data: a generalized estimating equation approach. Biometrics 1988;44:1049–60.
(47) Burton P, Gurrin L, Sly P. Extending the simple linear regression model for correlated responses: an introduction to generalized estimating equations and multi-level mixed modeling. Stat Med1998;17:1261–91.

Regresar al temario de el
Boletín Epidemiológico, Vol. 25 No. 1, marzo 2004