Todos estamos familiarizados con los estudios de observación que el intento de establecer un vínculo causal entre un no aleatorizados predictor X y un resultado mediante la inclusión de todos los imaginables potencial factor de confusión en un modelo de regresión múltiple. Por lo tanto, "controlar" todos los factores de confusión, el argumento va, aislar el efecto de la predictor de interés.
Estoy desarrollando un creciente malestar con esta idea, basada principalmente en la mano de las observaciones de varios profesores de mis estadísticas clases. Caen en un par de categorías principales:
1. Sólo se puede controlar por covariables que pensar y medir.
Esto es obvio, pero me pregunto si es que en realidad la más perniciosa e insuperable de todos.
2. El enfoque ha llevado a feo errores en el pasado.
Por ejemplo, Petitti & Freedman (2005) discutir cómo las décadas estadísticamente ajustado estudios observacionales llegó a desastrosamente conclusiones incorrectas sobre el efecto de la terapia de reemplazo hormonal en riesgo de enfermedades del corazón. Más tarde Eca encuentra casi enfrente de efectos.
3. El predictor de los resultados de la relación puede comportarse de forma extraña cuando el control de las covariables.
Yu-Kang Tu, Gunnell, Y Gilthorpe (2008) a discutir algunas de las diferentes manifestaciones, incluyendo la del Señor La paradoja, de la Paradoja de Simpson, y supresor de variables.
4. Es difícil para un solo modelo (regresión múltiple) adecuadamente ajustar por covariables y, simultáneamente, el modelo de la predictor de los resultados de la relación.
He escuchado esto da como razón de la superioridad de los métodos como a los puntajes de propensión y estratificación de factores de confusión, pero no estoy seguro de que realmente lo entiendo.
5. El ANCOVA modelo requiere que la covariable y predictor de interés para ser independiente.
Por supuesto, hemos de ajustar por factores de confusión, precisamente PORQUE están correlacionados con el factor de predicción de interés, por lo que, parece, el modelo tendrá éxito en la exacta instancias cuando queremos más. El argumento de que el ajuste es adecuado sólo para reducción de ruido en ensayos aleatorios. Miller & Chapman, de 2001 a dar una gran revisión.
Así que mis preguntas son:
- Cómo es la gravedad de estos problemas y otros, es posible que yo no sepa?
- Cuánto miedo debería ser cuando veo a un estudio que "los controles para todo"?
(Espero que esta pregunta no es aventurarse demasiado lejos en la discusión territorio y felizmente invitar a cualquier sugerencia para mejorar).
EDIT: he añadido el punto 5 después de encontrar una nueva referencia.