27 votos

Desde un punto de vista estadístico, ¿se puede inferir la causalidad utilizando puntuaciones de propensión con un estudio observacional?

Pregunta: Desde el punto de vista del estadístico (o de un profesional), ¿se puede inferir la causalidad utilizando puntuaciones de propensión con un estudio observacional ( no es un experimento )?

Por favor, no quiero iniciar una guerra de llamas o un debate fanático.

Antecedentes: Dentro de nuestro programa de doctorado en estadística, sólo hemos abordado la inferencia causal a través de grupos de trabajo y algunas sesiones temáticas. Sin embargo, hay algunos investigadores muy destacados en otros departamentos (por ejemplo, HDFS, Sociología) que las utilizan activamente.

Ya he sido testigo de un debate bastante acalorado sobre esta cuestión. No es mi intención iniciar uno aquí. Dicho esto, ¿qué referencias has encontrado? ¿Qué puntos de vista tiene? Por ejemplo, un argumento que he oído en contra de las puntuaciones de propensión como técnica de inferencia causal es que nunca se puede inferir la causalidad debido al sesgo de las variables omitidas: si se omite algo importante, se rompe la cadena causal. ¿Es éste un problema irresoluble?

Descargo de responsabilidad: Es posible que esta pregunta no tenga una respuesta correcta - completamente genial con el clic de cw, pero personalmente estoy muy interesado en las respuestas y estaría feliz con algunas buenas referencias que incluyan ejemplos del mundo real.

17voto

DavLink Puntos 101

Al principio de un artículo destinado a promover el uso de los PS en epidemiología, Oakes y Church (1) citaron las afirmaciones de Hernán y Robins sobre el efecto de confusión en epidemiología (2):

¿Puede garantizar que los resultados de su estudio observacional son no se ven afectados por factores de confusión no medidos? La única respuesta que puede dar un epidemiólogo proporcionar es "no".

Esto no sólo quiere decir que no podemos asegurar que los resultados de los estudios observacionales sean insesgados o inútiles (porque, como dijo @propofol, sus resultados pueden ser útiles para el diseño de ECAs), sino también que los PS ciertamente no ofrecen una solución completa a este problema, o al menos no producen necesariamente mejores resultados que otros métodos de emparejamiento o multivariantes (véase, por ejemplo, (10)).

Las puntuaciones de propensión (PS) son, por construcción, probabilístico no causal indicadores. La elección de las covariables que entran en la función de puntuación de propensión es un elemento clave para garantizar su fiabilidad, y su debilidad, como se ha dicho, radica principalmente en que no se controlan los factores de confusión no observados (lo que es bastante probable en los estudios retrospectivos o caso-control estudios). Hay que tener en cuenta otros factores: (a) la especificación errónea del modelo afectará a las estimaciones del efecto directo (aunque no más que en el caso de las MCO), (b) puede haber datos perdidos a nivel de las covariables, (c) los PS no superan los efectos sinérgicos que se sabe que afectan a la interpretación causal (8,9).

En cuanto a las referencias, encontré las diapositivas de Roger Newson Causalidad, factores de confusión y puntuaciones de propensión -- relativamente equilibrado sobre los pros y los contras del uso de las puntuaciones de propensión, con ilustraciones de estudios reales. También hubo varios buenos artículos sobre el uso de las puntuaciones de propensión en estudios observacionales o de epidemiología ambiental hace dos años en Estadísticas en medicina y adjunto un par de ellas al final (3-6). Pero me gusta la reseña de Pearl (7) porque ofrece una perspectiva más amplia de las cuestiones de causalidad (los PS se discuten en las páginas 117 y 130). Evidentemente, encontrará muchas más ilustraciones si observa la investigación aplicada. Me gustaría añadir dos artículos recientes de William R Shadish que se encuentran en el sitio web de Andrew Gelman (11,12). Se discute el uso de las puntuaciones de propensión, pero los dos artículos se centran más en la inferencia causal en los estudios observacionales (y cómo se compara con los entornos aleatorios).

Referencias

  1. Oakes, J.M. y Church, T.R. (2007). Comentario invitado: Avanzando en los métodos de puntuación de propensión en epidemiología . Revista Americana de Epidemiología , 165(10), 1119-1121.
  2. Hernán M.A. y Robins J.M. (2006). Instrumentos para la inferencia causal: ¿el sueño del epidemiólogo? Epidemiología , 17, 360-72.
  3. Rubin, D. (2007). El diseño frente al análisis de los estudios observacionales en busca de efectos causales: Paralelismos con el diseño de los ensayos aleatorios . Estadísticas en medicina , 26, 20-36.
  4. Shrier, I. (2008). Carta al director . Estadísticas en medicina , 27, 2740-2741.
  5. Pearl, J. (2009). Observaciones sobre el método de puntuación de propensión . Estadísticas en medicina , 28, 1415-1424.
  6. Stuart, E.A. (2008). Desarrollo de recomendaciones prácticas para el uso de las puntuaciones de propensión: Discusión de 'A critical appraisal of propensity score matching in the medical literature between 1996 and 2003' por Peter Austin . Estadísticas en medicina , 27, 2062-2065.
  7. Pearl, J. (2009). Inferencia causal en estadística: Una visión general . Encuestas estadísticas , 3, 96-146.
  8. Oakes, J.M. y Johnson, P.J. (2006). Coincidencia de puntaje de propensión para la epidemiología social . En Métodos de Epidemiología Social J.M. Oakes y S. Kaufman (Eds.), pp. 364-386. Jossez-Bass.
  9. Höfler, M (2005). Inferencia causal basada en contrafactuales . BMC Medical Research Methodology , 5, 28.
  10. Winkelmayer, W.C. y Kurth, T. (2004). Puntuaciones de propensión: ¿ayuda o bombo y platillo? Nefrología Diálisis Trasplante , 19(7), 1671-1673.
  11. Shadish, W.R., Clark, M.H., y Steiner, P.M. (2008). ¿Pueden los experimentos no aleatorios dar respuestas precisas? Un experimento aleatorio que compara asignaciones aleatorias y no aleatorias . JASA , 103(484), 1334-1356.
  12. Cook, T.D., Shadish, W.R., y Wong, V.C. (2008). Tres condiciones en las que los experimentos y los estudios de observación producen estimaciones causales comparables: Nuevos hallazgos de las comparaciones entre estudios . Revista de Análisis y Gestión de Políticas , 27(4), 724-750.

11voto

simmosn Puntos 304

Las puntuaciones de propensión se utilizan normalmente en la literatura de emparejamiento. Las puntuaciones de propensión utilizan covariables previas al tratamiento para estimar la probabilidad de recibirlo. Básicamente, se utiliza una regresión (ya sea OLS normal o logit, probit, etc.) para calcular la puntuación de propensión con el tratamiento como resultado y las variables previas al tratamiento como covariables. Una vez que se obtiene una buena estimación de la puntuación de propensión, los sujetos con puntuaciones de propensión similares, pero con diferentes tratamientos recibidos, se emparejan entre sí. El efecto del tratamiento es la diferencia de medias entre estos dos grupos.

Rosenbaum y Rubin (1983) demuestran que el emparejamiento de los sujetos tratados y de control utilizando sólo la puntuación de propensión es suficiente para eliminar todo el sesgo en la estimación del efecto del tratamiento derivado de las covariables observadas antes del tratamiento utilizadas para construir la puntuación. Obsérvese que esta prueba requiere el uso de la verdadera puntuación de propensión, en lugar de una estimación. La ventaja de este enfoque es que convierte un problema de emparejamiento en múltiples dimensiones (una para cada covariable previa al tratamiento) en un caso de emparejamiento univariante, una gran simplificación.

Rosenbaum, Paul R. y Donald B. Rubin. 1983. " El papel central de la puntuación de propensión en los estudios observacionales de efectos causales ." Biometrika. 70(1): 41--55.

8voto

pmgjones Puntos 2372

Sólo un ensayo aleatorio prospectivo puede determinar la causalidad. En los estudios observacionales, siempre existirá la posibilidad de que haya una covariable no medida o desconocida que haga imposible atribuir la causalidad.

Sin embargo, los ensayos observacionales pueden proporcionar pruebas de una fuerte asociación entre x e y, y por lo tanto son útiles para la generación de hipótesis. A continuación, estas hipótesis deben confirmarse con un ensayo aleatorio.

7voto

Chris Marasti-Georg Puntos 17023

La cuestión parece implicar dos cosas que realmente deberían considerarse por separado. En primer lugar, si se puede inferir la causalidad a partir de un estudio observacional, y en este sentido se podrían contrastar las opiniones de, por ejemplo, Pearl (2009), que sostiene que sí siempre que se pueda modelar el proceso adecuadamente, frente a la opinión de @propofol, que encontrará muchos aliados en las disciplinas experimentales y que puede compartir algunas de las ideas expresadas en el ensayo (bastante oscuro pero no por ello menos bueno) de Gerber et al (2004). En segundo lugar, suponiendo que piense que se puede inferir la causalidad a partir de datos observacionales, podría preguntarse si los métodos de puntuación de propensión son útiles para hacerlo. Los métodos de puntuación de la propensión incluyen varias estrategias de condicionamiento, así como la ponderación de la propensión inversa. Lunceford y Davidian (2004) ofrecen una buena revisión. Tienen buenas propiedades, pero se requieren ciertos supuestos (más específicamente, la "independencia condicional") para que sean consistentes.

Sin embargo, un pequeño detalle: el emparejamiento de la puntuación de propensión y la ponderación también se utilizan en el análisis de experimentos aleatorios cuando, por ejemplo, hay un interés en calcular los "efectos indirectos" y también cuando hay problemas de deserción o abandono potencialmente no aleatorios (en cuyo caso lo que se tiene se asemeja a un estudio observacional).

Referencias

Gerber A, et al. 2004. "La ilusión de aprender de la investigación observacional". En Shapiro I, et al, Problemas y métodos en el estudio de la política , Cambridge University Press.

Lunceford JK, Davidian M. 2004. "Estratificación y ponderación mediante la puntuación de propensión en la estimación de los efectos causales del tratamiento: un estudio comparativo". Estadísticas en medicina 23(19):2937-2960.

Pearl J. 2009. Causalidad (2ª Ed.) , Cambridge University Press.

0voto

bobknows Puntos 131

La sabiduría convencional afirma que sólo Los ensayos controlados aleatorios (experimentos "reales") pueden identificar la causalidad.

Sin embargo, no es tan sencillo.

Una de las razones por las que la aleatorización puede no ser suficiente es que en las muestras "pequeñas" la ley de los grandes números no es "suficientemente fuerte" para garantizar que todos y cada uno las diferencias están equilibradas. La cuestión es: ¿qué es "demasiado pequeño" y cuándo empieza a ser "suficientemente grande"? Saint-Mont (2015) argumenta ici ¡que "lo suficientemente grande" bien puede comenzar en los miles (n>1000)!

Al fin y al cabo, de lo que se trata es de equilibrar las diferencias entre grupos, de controlar las diferencias. Así que, incluso en los experimentos, hay que tener mucho cuidado para equilibrar las diferencias entre los grupos. Según los cálculos de Saint-Mont (2015), es muy posible que en las muestras más pequeñas se pueda mejorar considerablemente con muestras emparejadas (equilibradas manualmente).

En cuanto a la probabilidad. Por supuesto, la probabilidad es nunca capaz de dar una respuesta concluyente, a menos que la probabilidad sea extrema (cero o uno). Sin embargo, en la ciencia nos encontramos con frecuencia con situaciones en las que no podemos dar una respuesta concluyente porque las cosas son difíciles. De ahí la necesidad de la probabilidad. La probabilidad no es más que una forma de expresar nuestra incertidumbre en un enunciado. Como tal, es similar a la lógica; véase Briggs (2016) ici .

Por lo tanto, la probabilidad nos ayudará pero no dará respuestas concluyentes, ninguna certeza. Pero es de gran utilidad: para expresar la incertidumbre.

Obsérvese también que la causalidad no es principalmente una cuestión estadística. Supongamos que dos medias difieren "significativamente". ¿No significa que la variable de agrupación sea la causa de la diferencia en la variable medida? No (no necesariamente). Independientemente de la estadística que se utilice (puntuación de propensión, valores p, factores de Bayes, etc.), estos métodos no son (prácticamente) nunca suficientes para respaldar las afirmaciones de causalidad.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X