Consideremos la regresión y=x1+x2+x3+ε
Se sabe que x2 y x3 afectan a x1 pero x2 y x3 no afectan a y . x1 puede afectar y pero sólo en una pequeña medida. El RMSE es ligeramente inferior si añadimos x2 y x3 en comparación con la regresión y=x1+ε .
No hay multicolinealidad. Dado el objetivo de estimar los efectos de x1 en y ¿Cuáles son los argumentos para incluir o excluir x1 y x2 en las regresiones? Un argumento a favor de añadir x2 y x3 : ¿Es que podemos estimar los efectos puros de x1 en y ?