Bueno, en primer lugar, la variable ficticia se interpreta como un cambio de intercepción. Es decir, su coeficiente $\beta_3$ le da la diferencia en el intercepto cuando $D=1$ es decir, cuando $D=1$ el intercepto es $\beta_0 + \beta_3$ . Esa interpretación no cambia al añadir el cuadrado $x_1$ .
Ahora, el punto de añadir un cuadrado a la serie es que usted asume que la relación se desvanece en un cierto punto. Mirando tu segunda ecuación
$$y = \beta _0 + \beta_1x_1+\beta_2x_1^2+\beta_3 D + \varepsilon$$
Tomando la derivada con respecto a $x_1$ produce
$$\frac{\delta y}{\delta x_1} = \beta_1 + 2\beta_2 x_1$$
Al resolver esta ecuación se obtiene el punto de inflexión de la relación. Como explicó el usuario1493368, esto está reflejando efectivamente una forma de U inversa si $\beta_1<0$ y viceversa. Tomemos el siguiente ejemplo:
$$\hat{y} = 1.3 + 0.42 x_1 - 0.32 x_1^2 + 0.14D$$
La derivada con respecto a $x_1$ es
$$\frac{\delta y}{\delta x_1} = 0.42 - 2*0.32 x_1 $$
Resolver para $x_1$ le da
$$\frac{\delta y}{\delta x_1} = 0 \iff x_1 \approx 0.66 $$
Ese es el punto en el que la relación tiene su punto de inflexión. Puedes echar un vistazo a Wolfram-Alpha's de la función anterior, para visualizar un poco su problema.
Recuerde que al interpretar el efecto ceteris paribus de un cambio en $x_1$ en $y$ Hay que mirar la ecuación:
$$\Delta y = (\beta_1 + 2\beta_2x_1)\Delta x$$
Es decir, no se puede interpretar $\beta_1$ de forma aislada, una vez añadido el regresor al cuadrado $x_1^2$ ¡!
En cuanto a su insignificante $D$ después de incluir el cuadrado $x_1$ apunta a un sesgo de mala especificación.
0 votos
posible duplicado de Por qué los resultados de ANOVA/Regresión cambian cuando se controla por otra variable
1 votos
La razón más probable: $x_{1}^2$ y $D$ parecen explicar la misma variabilidad en $y$
3 votos
Una cosa que puede ayudar es centrar $x$ antes de creando su término al cuadrado (ver aquí ). En cuanto a la interpretación de su término al cuadrado, sostengo que es mejor interpretar $\beta_1x_1+\beta_2x_1^2$ en su conjunto (ver aquí ). Otra cosa es que puede necesitar una interacción, es decir, añadir $\beta_4x_1D+\beta_5x_1^2D$ .
0 votos
No creo que sea realmente un duplicado de esa pregunta; la solución es diferente (el centrado de variables funciona aquí, pero no allí, a menos que me equivoque)
0 votos
@Peter, interpreto esta pregunta como un subconjunto de "¿Por qué cuando añado una variable a mi modelo, la estimación del efecto/ $p$ -¿Cambia el valor de alguna otra variable?", que se aborda en la otra pregunta. Entre las respuestas a esas preguntas están la colinealidad (a la que Gung sí alude en su respuesta a que pregunta)/solapamiento de contenido entre predictores (es decir, entre $D$ y $(x_1,x_1^2)$ que sospecho que es el culpable en este caso). La misma lógica se aplica aquí. No estoy seguro de cuál es la controversia, pero está bien si usted y otros no están de acuerdo. Saludos.
0 votos
@Macro Estoy de acuerdo en que la colinealidad es probablemente el problema aquí, pero cuando el problema es causado por una variable cuadrada, el centrado elimina el problema. No creo que esto funcione para dos variables relacionadas (como en el otro problema). ¿Me equivoco?
0 votos
@Peter, como la respuesta es colinealidad/solapamiento de contenidos, creo que eso lo convierte en un subconjunto de la otra pregunta. Las soluciones para la colinealidad pueden depender del contexto, pero no creo que esto lo convierta en una pregunta diferente. Para abordar su comentario directamente - centrado puede aliviar el problema pero si $D$ (o $P(D=1)$ ) es una función de $x_1$ Entonces es casi seguro que no, en cuyo caso se vuelve aún más al contenido transmitido en la pregunta enlazada. Sigo sin ver la controversia, pero no hace falta que nos pongamos de acuerdo en esto, así que terminemos aquí la conversación de duplicado vs. no duplicado. Saludos.
0 votos
Macro y Peter tienen razón. Nuestra política es identificar cerrar duplicados; si puede haber alguna dificultad para decidir si una pregunta es realmente un duplicado, entonces no está lo suficientemente cerca. Sin embargo, la presente pregunta ha sido respondida en muchos hilos de este sitio: un poco más de diligencia en la búsqueda probablemente producirá mucho material útil y relevante.
0 votos
Muy estrechamente relacionados: La adición de términos cuadráticos y de interacción al modelo afecta a la significación ...
0 votos
Consulte la entrada de mi blog para ver una sencilla guía paso a paso y cómo interpretar la variable edad y edad al cuadrado. El ejemplo sigue la ecuación salarial mencionada en el post anterior. excel-con-datos.es/blog-1/
0 votos
En este momento, el enlace a la entrada del blog que acaba de mencionar @user34889 ya no está activo, lo que subraya el consejo frecuente aquí de desconfiar de la publicación de tales enlaces a menos que se sepa que son estables.