6 votos

Análisis de emparejamiento de puntuación de propensión posterior

Quiero investigar los efectos causales de un programa educativo sobre un resultado de empleo binario (positivo o negativo). Tengo dos grupos de estudiantes: uno que siguió el programa educativo (el grupo de tratamiento) y otro que no lo hizo (el grupo de control).

Los grupos están muy desequilibrados proporcionalmente en cuanto a los datos demográficos de fondo. He implementado el emparejamiento de puntuación de propensión 1:1 del vecino más cercano utilizando los datos demográficos de fondo como el sexo, la etnia, la clase socioeconómica, etc. en el MatchIt en R. Después de evaluar mis estadísticas de equilibrio, ahora estoy seguro de que la muestra está bien emparejada en estos datos demográficos de fondo.

He pasado mucho tiempo buscando en documentos como Stuart (2010) y Austin (2007) con respecto a los consejos sobre cómo proceder con el análisis posterior al emparejamiento y aquí es donde comienza mi confusión.

Estoy tratando de seguir el documento de Stuart. y sugiere que no es necesario tener en cuenta los pares emparejados después del emparejamiento k:1, sino que "basta con condicionar las variables que se utilizaron en el proceso de emparejamiento (por ejemplo, mediante un modelo de regresión)". ¿Debo interpretar esto como la inclusión de los datos demográficos de fondo, junto con el indicador del programa educativo como variables independientes en el modelo de regresión logística, siendo el resultado del empleo mi variable dependiente (por ejemplo, utilizando glm en R)? ¿O me sugiere que debería utilizar la regresión logística condicional? Según tengo entendido, la regresión logística condicional tiene en cuenta el aspecto emparejado de los datos, ¿es así?

Tampoco estoy seguro de si es apropiado incorporar los datos demográficos de fondo en la modelización del análisis de emparejamiento de la puntuación de propensión. He visto que algunos estudios lo hacen porque dicen que, aunque no haya diferencias entre los grupos de tratamiento/control en estas variables, pueden tener un impacto en el resultado de interés, por ejemplo, aunque las clases socioeconómicas de los estudiantes que están o no en el programa educativo estén equilibradas, esta variable puede tener un impacto en el resultado del empleo. También he visto que algunos estudios las ignoran por completo.

No tengo acceso a muchos libros, pero me alegra que me dirijan a los documentos disponibles en la web.

2voto

Somujit Puntos 31

Stuart et al. mencionan el paquete R Zelig, que parece funcionar sin problemas para el análisis posterior al emparejamiento con MatchIt. Se menciona con bastante frecuencia que NO hay que limitarse a comparar las medias después del emparejamiento, aunque es una práctica bastante común. Se puede hacer un uso óptimo del proceso de emparejamiento utilizando modelos de regresión. Una vez realizado el emparejamiento, es necesario realizar más análisis estadísticos (paramétricos). análisis estadísticos (paramétricos). El emparejamiento es sólo un primer paso. Puede considerarse como un método no paramétrico de preprocesamiento de los datos para crear un estudio cuasi aleatorio y así disminuir o eliminar la dependencia de las variables de resultado de las covariables de confusión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X