Quiero investigar los efectos causales de un programa educativo sobre un resultado de empleo binario (positivo o negativo). Tengo dos grupos de estudiantes: uno que siguió el programa educativo (el grupo de tratamiento) y otro que no lo hizo (el grupo de control).
Los grupos están muy desequilibrados proporcionalmente en cuanto a los datos demográficos de fondo. He implementado el emparejamiento de puntuación de propensión 1:1 del vecino más cercano utilizando los datos demográficos de fondo como el sexo, la etnia, la clase socioeconómica, etc. en el MatchIt
en R. Después de evaluar mis estadísticas de equilibrio, ahora estoy seguro de que la muestra está bien emparejada en estos datos demográficos de fondo.
He pasado mucho tiempo buscando en documentos como Stuart (2010) y Austin (2007) con respecto a los consejos sobre cómo proceder con el análisis posterior al emparejamiento y aquí es donde comienza mi confusión.
Estoy tratando de seguir el documento de Stuart. y sugiere que no es necesario tener en cuenta los pares emparejados después del emparejamiento k:1, sino que "basta con condicionar las variables que se utilizaron en el proceso de emparejamiento (por ejemplo, mediante un modelo de regresión)". ¿Debo interpretar esto como la inclusión de los datos demográficos de fondo, junto con el indicador del programa educativo como variables independientes en el modelo de regresión logística, siendo el resultado del empleo mi variable dependiente (por ejemplo, utilizando glm
en R)? ¿O me sugiere que debería utilizar la regresión logística condicional? Según tengo entendido, la regresión logística condicional tiene en cuenta el aspecto emparejado de los datos, ¿es así?
Tampoco estoy seguro de si es apropiado incorporar los datos demográficos de fondo en la modelización del análisis de emparejamiento de la puntuación de propensión. He visto que algunos estudios lo hacen porque dicen que, aunque no haya diferencias entre los grupos de tratamiento/control en estas variables, pueden tener un impacto en el resultado de interés, por ejemplo, aunque las clases socioeconómicas de los estudiantes que están o no en el programa educativo estén equilibradas, esta variable puede tener un impacto en el resultado del empleo. También he visto que algunos estudios las ignoran por completo.
No tengo acceso a muchos libros, pero me alegra que me dirijan a los documentos disponibles en la web.