En un ANCOVA, normalmente modelo
$$E(Y|T,X)=\gamma T+X \beta$$
donde $Y$ es la variable de resultado, $T$ es su tratamiento del indicador ($T=0$ a indicar de control, y $T=1$ a indicar el tratamiento), y $X$ es una covariable (o un vector de covariables). A continuación, $\gamma$ es el efecto medio del tratamiento (ATE) condicional en $X$.
Ahora vamos a $Y=TY^T+(1-T)Y^C$ donde $Y^T$ es el resultado de treamtent grupo y $Y^C$ es el resultado en el grupo de control. La principal suposición, que es explotada por ANCOVA, es que las variables de resultado $Y^T$ $Y^C$ son independientes de $T$ condicional en $X$. Esto también se llama 'unconfoundedness' se escribe como:
$$P(T|Y^T,Y^C,X)=P(T|X)$$
De lo contrario, las variables de resultado y el tratamiento de asignación son confundidos y (condicional) diferencias de medias en $Y^T$ $Y^C$ puede ser causada por otros factores que la manipulación (es decir, incluso le $X$). Si $T$ $Y^C$ $Y^T$ son unconfounded condicional en $X$, el ATE estimación $\gamma$ de ANCOVA será imparcial dado que también todos los demás supuestos del modelo se cumplen.
Usted puede pedir cuando es claro si hay unconfoundedness: esto nunca puede ser evaluado con absoluta certeza y representa la clave de la debilidad de ajuste de sesgo en los estudios observacionales. Se recomienda (ver ref. a continuación) que incluye todas las covariables que se encuentran en una tendencia (p<.10) asociado estadísticamente (correlación) con $T$, $Y^C$ o $Y^T$. Esto sugiere que no es un problema, más bien deseable, que $X$ $T$ están correlacionadas cuando mediante ANCOVA (su primera pregunta).
De hecho, la correlación de la covariable(s) con la variable dependiente " dentro de los grupos (es decir, $X$ $Y^C$ o $Y^T$) es una indicación de que el unconfoundedness asunción tiene o es más plausible (su segunda pregunta). Pero la correlación con el $T$ asimismo indica que esta. Sin embargo: un 'ideal' $X$ covariable es asociado, en tanto, el tratamiento del indicador y las variables de resultado. Desde el ANOVA no incluye $X$ (su tercera pregunta), que asumiría la unconfoundedness incondicional $X$, es decir,, $$P(T|Y^T,Y^C)=P(T)$$which is a very strong assumption and dependence of $ X$ and $T$ would point to its potential violation. It is therefore not recommended in your hypothetical situation and should be preserved to fully randomized experiments, in which any $$ X por definición es independiente del tratamiento y las variables criterio.
Es importante tener en cuenta que la reunión de todos los otros supuestos del modelo de ANCOVA es necesario encontrar imparcial COMIÓ las estimaciones (por ejemplo, el uso de los estimadores de mínimos cuadrados). Principalmente, esto sugiere que no hay ninguna interacción entre el$T$$X$. A veces esto se conoce como efecto de la homogeneidad (como opuesto a hetorogenous efectos, si existe una interacción). Por lo tanto, el modelo debe incluir por lo menos las interacciones así, que no es estándar en los modelos ANCOVA. Además, usted asume la linealidad (inspeccionar los residuos para comprobar esta suposición) y también asumir que la Y-el modelo es correcto (es decir, que incluyó todas las $X$ modelo $Y$).
A veces, la puntuación de propensión y métodos no paramétricos métodos de coincidencia son superiores a ANCOVA debido a que no cuentan con la suposición de linealidad y pueden incluir interacciones 'sobre la marcha'. Por otra parte, los llamados de doble métodos robustos combinar Y-modelado con puntaje de propensión métodos. Garantizan imparcial estimaciones del efecto, incluso si el modelo de $Y$ es incorrecta (suponiendo que la puntuación de propensión modelo es correcto). Todavía todos estos métodos de hacer la unconfoundedness asunción.
Para un excelente tratamiento de ANOCVA ajuste por sesgo de selección (y también otros métodos) ver:
Schafer, J. L., & Kang, J. (2008). El promedio de los efectos causales de estudios no aleatorizados: Una guía práctica y simulada ejemplo. Métodos Psicológicos, 13(4), 279-313. doi:10.1037/a0014268