15 votos

¿Es el emparejamiento de la puntuación de propensión un "MUST" para los estudios científicos?

Recientemente, he estado leyendo sobre el Propensity Score Matching :

enter image description here

Si lo he entendido bien, el Propensity Score Matching se utiliza para construir grupos de control/tratamiento en estudios científicos, de forma que los individuos del grupo de control sean lo más parecidos posible a los del grupo de tratamiento. En otras palabras, un individuo de uno de estos grupos se "empareja" con un individuo equivalente del otro grupo. Esto se hace para reducir el riesgo de que las variables "latentes e inobservadas" cofundan los efectos de los tratamientos, y que "se comparen manzanas con manzanas" en lugar de "manzanas con naranjas".

A primera vista, esto parece muy importante: después de todo, si estamos probando los efectos de algún fármaco en dos grupos de personas similares, nos gustaría evitar el riesgo de que uno de estos grupos esté compuesto principalmente por atletas olímpicos y el otro por personas mayores (suponiendo que el objetivo del estudio sea comparar los efectos del fármaco en grupos de personas similares).

Mi pregunta: Sólo para aclarar: ¿la mayoría de los investigadores intentan aplicar alguna forma de emparejamiento de puntuación de propensión cuando realizan este tipo de estudios estadísticos? ¿Se trata de una " debe "?

Si alguna forma de Propensity Score Matching no se implementa correctamente en relación con el objetivo del estudio, ¿supone esto un alto riesgo de invalidar el estudio estadístico? Según el artículo de Wikipedia ( https://en.wikipedia.org/wiki/Propensity_score_matching ), el Propensity Score Matching se popularizó en la década de 1980. ¿Sugiere esto que los estudios estadísticos realizados antes de la década de 1980 eran más propensos a sufrir este tipo de efectos de confusión de variables no deseadas?

2 votos

La alternativa es esperar que la aleatorización de los sujetos en dos (o tres o más) grupos funcione como se pretende. Si realmente se pueden encontrar "gemelos falsos" (o "trillizos" o bloques), se podría reducir la variabilidad y se podría utilizar una prueba pareada en lugar de una prueba de dos muestras. En la práctica, yo diría que la "coincidencia de puntuaciones" es siempre deseable y rara vez se puede conseguir.

6 votos

No, la puntuación de propensión no es una "obligación" para la inferencia causal. Las puntuaciones de propensión pueden ser útiles, pero tienen inconvenientes. Véase la crítica de Hernán y Robins en el capítulo 15: Modelos de propensión, modelos estructurales, modelos predictivos de Inferencia causal: ¿Qué pasa si?

1 votos

Estoy de acuerdo con los dos comentarios anteriores (+1). También añadiría que se podría argumentar razonablemente que cuando se trata de observatorio datos, entonces es "muy deseable" aclarar por qué no se utilizan las puntuaciones de propensión (o cualquier otra metodología cuasi-experimental), es decir, por qué consideraríamos que una muestra de "conveniencia" es tan buena como la que se generaría según los principios del diseño experimental.

27voto

Noah Puntos 85

Los métodos de puntuación de propensión son un tipo de método utilizado para ajustar los factores de confusión. Existen otros métodos que se basan en diferentes supuestos. Algunos de los más populares son la diferencia en diferencias, que se basa en una suposición sobre la estabilidad en el tiempo, y el análisis de variables instrumentales, que se basa en una suposición sobre la aleatorización de alguna otra variable. Una tercera clase de métodos incluye los que se basan en el supuesto de que se han medido todas las variables de confusión. Recomiendo encarecidamente este artículo de 2020 de Matthay et al. para una comparación de estos métodos.

Los métodos de puntuación de la propensión pertenecen a esta última clase. Otros métodos también pertenecen a esta clase, como el ajuste de regresión, los métodos "g" y los métodos doblemente robustos. Todos ellos son formas diferentes de ajustar la confusión de las covariables medidas condicionándolas de determinadas maneras. Difieren principalmente en su rendimiento estadístico bajo varios supuestos sobre la forma funcional de los procesos de tratamiento y resultado.

Hay varias formas de utilizar las puntuaciones de propensión, incluyendo el emparejamiento (que usted ha descrito), la ponderación, la subclasificación y el ajuste de regresión, y hay formas de realizar cada uno de estos métodos sin puntuaciones de propensión. Menciono todo esto para que vea las puntuaciones de propensión como una implementación particular de métodos que en sí mismos son miembros de una amplia clase de métodos que es una de las varias clases de métodos que uno puede usar para ajustar la confusión. Los métodos de puntuación de propensión no son necesariamente superiores a ninguno de ellos, y su ubicuidad es probablemente un artefacto cultural más que una verdadera justificación por su rendimiento estadístico.

He aquí algunas razones (y refutaciones) de por qué la puntuación de propensión puede ser popular:

  • Son fáciles de aplicar (pero sólo en su forma más básica y de menor rendimiento; para utilizarlas bien se requieren amplios conocimientos)
  • Son fáciles de explicar al público no especializado (pero también lo son muchos métodos que no implican puntuaciones de propensión, como otros métodos de emparejamiento)
  • Suelen ser eficaces a la hora de eliminar los sesgos debidos a la confusión (pero hay varios métodos que son manifiestamente mejores, especialmente mejores que los métodos de puntuación de la propensión, que son los más utilizados)
  • Separan la fase de diseño y la de análisis, lo que conduce a una investigación más reproducible y a la disminución de la dependencia de los modelos (pero cuando se utilizan mal pueden aumentar la dependencia de los modelos y no son inmunes al fisgoneo y al uso nefasto o erróneo)
  • Están implementados en la mayoría de los programas informáticos de estadística (pero también lo están muchos otros métodos, y se implementan de forma diferente en cada programa)
  • Son una forma de reducción de la dimensión en conjuntos de datos de alta dimensión (pero hay otras formas de reducir la dimensionalidad, y aún así las puntuaciones de propensión se utilizan incluso para ajustar unas pocas covariables)
  • Dependen menos de las hipótesis de modelización que los métodos basados en la regresión (pero hay muchos otros métodos que también permiten una flexibilidad extrema con un rendimiento a menudo mejorado)
  • Suenan elegantes y hacen que el analista parezca sofisticado (pero los estadísticos experimentados pueden señalar fácilmente los errores que los usuarios aficionados cometen constantemente)

(Puede que piense que estoy en contra de las puntuaciones de propensión, pero compruebe el propensity-scores y ver mi participación. También soy el autor de varios paquetes de R para facilitar el uso de los métodos de puntuación de propensión).

En mi opinión, las puntuaciones de propensión se utilizan en exceso (o, en el mejor de los casos, no se justifican) en la literatura médica. Hay muchos métodos más sofisticados y de mejor rendimiento que se basan en los mismos supuestos que los métodos de puntuación de propensión y que están infravalorados en la investigación médica, a menudo porque los analistas y revisores de la investigación médica no están familiarizados con ellos. Espero animar a la gente a considerar las puntuaciones de propensión como un opción en un vasto mar de opciones, cada una de las cuales tiene sus propias ventajas e inconvenientes que la hacen más o menos adecuada para un determinado problema. Decidir qué opción es la mejor para un problema determinado requiere la ayuda de un estadístico especialmente formado en el ámbito de la estimación del efecto causal.

0 votos

Respuesta muy informativa. Sería muy útil que mencionaras algunas alternativas importantes disponibles en "un vasto mar de opciones".

1 votos

(+1 obviamente) @rnso: "diferencia en diferencias", "análisis de variables instrumentales", "ajuste de regresión, métodos 'g' y métodos doblemente robustos" se mencionan en el texto.

1 votos

1/2 +1 (de verdad. :) Creo que vale la pena señalar algunas de las dificultades que presentan las puntuaciones de propensión para la comunicación y la transportabilidad de los resultados sustantivos. De Hernán & Robins: La modificación del efecto a través de los estratos de propensión puede interpretarse como una prueba de que los responsables de la toma de decisiones saben lo que están haciendo, por ejemplo, que los médicos tienden a tratar a los pacientes que tienen más probabilidades de beneficiarse del tratamiento (Kurth et al 2006). Sin embargo, la presencia de la modificación del efecto por $\pi(L)$ puede complicar la interpretación de las estimaciones.

12voto

mribeirodantas Puntos 122

Como señaló Alexis, el emparejamiento de puntuaciones de propensión (PSM) es una de las muchas herramientas que tenemos en la inferencia causal. Otra es Estimador ponderado de probabilidad inversa (IPWE) . También puede utilizar descubrimiento causal para inferir un diagrama causal y utilizar do-calculus para estimar el efecto causal. O hacer uso de estimación de variables instrumentales . Sólo estoy lanzando un montón de nombres aquí (aunque con enlaces, por si quieres ver más sobre ello) con una única intención: Mostrarte que son muchas las herramientas que tienes cuando tu objetivo es inferencia causal en datos observacionales . Todos hacen algo específico y tienen sus ventajas y limitaciones.

¿Debemos utilizar siempre estas herramientas cuando queramos hacer una inferencia causal en datos observacionales? Sí. ¿Se trata de todos los estudios científicos? No. ¿Cuál es el mejor? Depende de lo que quieras, de cómo lo quieras y de lo que tengas :-).

Una última cosa: latente y no observado son sinónimos en este contexto. Los factores de confusión latentes y los no observados se refieren a lo mismo. Además, los factores de confusión no son el único enemigo a la hora de inferir la causalidad. El sesgo de colisión es otro y el emparejamiento de la puntuación de propensión no tiene en cuenta el sesgo debido a la censura .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X