Supongamos que tengo una variable dependiente que es la puntuación de un examen, $score^*_{i}$ . Se ha estandarizado para la edad y el sexo. Quiero medir el efecto que tiene una variable binaria, por ejemplo la adopción, en la puntuación de las personas en el test. ¿Causará algún problema si incluyo la edad y el sexo como controles en la regresión de la puntuación sobre la adopción (dado que se utilizaron para estandarizar la variable dependiente)?
Es decir, estoy haciendo una regresión (usando OLS estándar):
$score^*_{i} = (score_{i} - \alpha_{1}AGE_{i} - \alpha_{2}Gender_{i}) = \beta_{0} + \beta_{1}Age_{i} + \beta_{2}Gender_{i} + \beta_{3}Adopted_{i} + \epsilon_{i}$
donde $score_{i}$ es la puntuación bruta (es decir, la puntuación no estandarizada), $\epsilon_{i}$ es el término de error iid. Quiero saber si $\beta_{3}$ ¿se ve afectado por la inclusión de la edad y el género?
Mi opinión es que esto puede sesgar las estimaciones OLS de los coeficientes de edad y género, pero que no afectaría a la estimación de interés: la estimación de Adopción.
¿Es esto correcto? ¿O es totalmente erróneo incluir la edad y el sexo como controles en este escenario? Si es así, ¿podría explicar por qué?
Gracias.