Esto me ha estado molestando mucho y esperaba una explicación (¡sencilla!) si fuera posible.
Supongamos que he especificado un modelo de regresión lineal: $$ Y = \beta_0 + \beta_1 X + \epsilon $$ Y una alternativa: $$ Y = \beta_0 + \beta_1 X + \beta_2 X^2 + \epsilon $$ Y estoy tratando de estimar el $\beta$ s, digamos quizás a través de OLS (el método exacto no creo que sea relevante).
Mi pregunta es: ¿cuál es la interpretación exacta del $\beta$ s que estoy tratando de estimar?
La confusión se debe a que los valores poblacionales de $\beta_1$ en cualquiera de las especificaciones son presumiblemente diferentes, y esto no se acopla con mi comprensión de los coeficientes de población.
Siempre había interpretado el $\beta$ s como la derivada parcial de $X$ en $Y$ "en realidad". Es decir, si se cambiaba X manteniendo constantes los demás regresores, el cambio en el valor esperado de Y. Proporcionando un modelo cada vez mejor especificado, se aseguraba que la estimación de $\beta_1$ se hizo más preciso (al separar las variables correlacionadas en el término de error).
Esto era importante para mi comprensión; $\beta_1$ no dependía de la especificación de mi modelo -seguía siendo una característica invariante de la población-, sino del estimador que teníamos para $\beta_1$ (b1) cambiaba y se volvía más o menos preciso según el modelo.
Está muy bien, pero esta interpretación no funciona en el ejemplo anterior. Supongamos que la relación entre $X$ y $Y$ es curvilínea. Si estuviera restringido a incluir sólo $X$ y no cualquier polinomio de orden superior, entonces presumiblemente el $\beta_1$ que mejor describa el cambio en $E[Y]$ dado un cambio en $X$ sería diferente que si se permitieran polinomios de orden superior (en la especificación 2).
Así que digamos, por el bien de los argumentos, el DGP fue $$ E[Y] = 1 + 10 X - 2 X^2 $$ donde $0<X<2$ para que el polinomio no influya demasiado. En este caso, el valor real de $X$ en la especificación 1 sea 10? O, para ajustarlo a esa DGP cuando $X^2$ no se especifica ¿debería ser ~6?
Parece que si es esto último, mi idea de que los coeficientes de población no dependen de la especificación se esfuma. Por favor, ¡ayuda!
1 votos
Quizá quieras investigar el uso de polinomios ortogonales.
0 votos
No creo que se vea el resto del mensaje:Pongamos por caso que la DGP fuera y = 1 + 10X - 2.X^2 (0<X<2 para que el polinomio no influya demasiado). En este caso, ¿el valor real de X en la especificación 1 debería ser 10? O, para ajustarlo a esa DGP cuando no se especifica X^2 ¿debería ser ~6? Parece que si es esto último mi entendimiento de que los coeficientes poblacionales no dependen de la especificación se esfuma. Por favor, ¡ayuda!
0 votos
He editado para que aparezca el resto de la pregunta.