Independencia de medio de entendimiento en el ajuste de regresión

Question

Independencia de medio de entendimiento en el ajuste de regresión

Preguntado el 17 de Agosto, 2016: Cuando se hizo la pregunta
221 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

La noción de correlación ( $\mathbb{E}[XY]=0$ ) y la media de la independencia ( $\mathbb{E}[X|Y]=0$ ) son mencionados en la diferente configuración de los supuestos de la regresión. Sabemos que $\mathbb{E}[X|Y]=0$ implica $\mathbb{E}[XY]=0$ (pero no al revés). Aquí hay una pregunta específica acerca de la relación entre estas dos nociones en la regresión de ajuste.

Estamos viendo el efecto de si ir a la escuela o no en el salario de una población. Deje $D_i\in\{1,0\}$ ser la variable aleatoria indicar si los $i$ fue a la escuela ( $D_i=1$ ) o no ( $D_i=0$ ). Deje $Y_i$ el salario de las personas $i$ . Tenga en cuenta que si se puede FORZAR a todo el mundo en la población de ir a la escuela, entonces vamos a tener una distribución de los salarios que se denota por a $Y_{1i}$ , y del mismo modo, si se nos FUERZA a todas las personas que no van a la escuela, tenemos una distribución de los salarios que se denota por a $Y_{0i}$ .

Así que tenemos $Y_i = D_iY_{1i} + (1-D_i)Y_{0i}~~~~~~~~~~~~~~~(1)$ .

Tenga en cuenta que siempre podemos escribir $Y_{1i} =\mu_1+\epsilon_{1i}$ $Y_{0i} =\mu_0+\epsilon_{0i}$ , es decir, significa además de un ruido con una media de 0. A continuación, sustituimos estas 2 ecuaciones en la ecuación (1), tenemos

$Y_i=\mu_0+(\mu_1-\mu_0)D_i+\epsilon_i~~~~~~~(2)$ donde $\epsilon_i=\epsilon_{0i}+D_i(\epsilon_{1i}-\epsilon_{0i})$ Tenga en cuenta que $\epsilon_i$ tiene una media de 0 con claridad.

Así que la ecuación (2) describe el mundo real acerca de los salarios y de la escuela sin hacer ninguna hipótesis distinta de la media de $Y_{1i}$ $Y_{0i}$ es finito.

Tenga en cuenta que $\epsilon_i$ siempre dependiente de la con $D_i$ (pero no necesariamente están correlacionadas). Ahora supongamos $\epsilon_i$ $D_i$ están correlacionadas (en primer lugar, no sé lo que significa esto en la práctica), entonces sabemos que el estimador de MCO es consistente (por unbiasedness de OLS, se requeriría de la media de la independencia, es decir, $\mathbb{E}[\epsilon_i|D_i]=0$ ). Por lo $\mu_0$ $\mu_1$ es de identificación personal. En este caso, $\epsilon_i$ $D_i$ no es equivalente a $\mathbb{E}[\epsilon_i D_i]=0$ . Me pregunto si alguien podría explicar el significado subyacente de esta expresión en esta configuración.

Tenga en cuenta que una condición suficiente para $\mathbb{E}[\epsilon_i D_i]=0$ es que el $\mathbb{E}[\epsilon_i|D_i]=0$ . Puedo entender esta expresión, muy bien, que es "dado que la información de $D_i$ no va a cambiar la media de la variable aleatoria $\epsilon_i$ ". Tenga en cuenta que este es más débil que la noción de independencia, desde el $\epsilon_i$ independiente de $D_i$ significa que, dada la información de $D_i$ , la distribución de $\epsilon_i$ sigue siendo el mismo, que es mucho más fuerte que el primer momento es la misma (es decir, $\mathbb{E}[\epsilon_i|D_i]=0$ ).

La expresión $\mathbb{E}[\epsilon_i|D_i]=0$ puede ser explicado de forma intuitiva si nos fijamos en esta identificación del problema desde un ángulo diferente, tenemos:

$E[Y_i|D_i=1]-E[Y_i|D_i=0]=(\mu_1-\mu_0)+E[\epsilon_i|D_i=1]-E[\epsilon_i|D_i=0]=(\mu_1-\mu_0)+E[\epsilon_{1i}|D_i=1]-E[\epsilon_{0i}|D_i=0]$ .

Tenga en cuenta que observamos $E[Y_i|D_i=1]$ $E[Y_i|D_i=0]$ y queremos identificar a $\mu_1-\mu_0$ , lo que requiere de $E[\epsilon_{1i}|D_i=1]-E[\epsilon_{0i}|D_i=0]=0$ . Tenga en cuenta que si al azar asignar la escuela o de la escuela a la gente en la población, esto garantizará $E[\epsilon_{1i}|D_i=1]-E[\epsilon_{0i}|D_i=0]=0$ (o incluso si no tenemos la asignación al azar, pero de alguna manera, sabemos que $\mathbb{E}[\epsilon_i|D_i]=0$ , entonces todavía somos capaces de hacer esta afirmación).

Sin embargo, si sólo tenemos $\epsilon_i$ $D_i$ no están correlacionados, es decir, $E[\epsilon_i D_i]=0$ , esto no implicará $E[\epsilon_{1i}|D_i=1]-E[\epsilon_{0i}|D_i=0]=0$ . Pero entonces esto implica que el puramente vistazo a la media del grupo (es decir, $E[Y_i|D_i=1]$ $E[Y_i|D_i=0]$ ) no nos va a ayudar a identificar a $\mu_1-\mu_0$ , pero OLS va a lograr este objetivo. Dónde está mi lógica que va mal?

Preguntado el 17 de Agosto, 2016 por fivelitresofsoda

Answer 1

1 Respuestas

Answer 2

1voto

SHU Puntos 18

Aquí el supuesto de que $\epsilon_i$ $D_i$ están correlacionadas sin refiero a la celebración de la independencia es imposible cuando se $D_i$ toma sólo dos valores. Intuitivamente, la correlación mide la relación lineal entre los valores, por lo que para la media de la independencia para que no se sostenga en la presencia de una correlación cero, la media de $\mathbb{E}[\epsilon_i \mid D_i]$ debe ser una función no lineal de $D_i$ . Pero con sólo dos valores posibles para $D_i$ , no hay espacio para la no linealidad.

Prueba

Supongamos $\mathbb{E}[\epsilon_i]=0,~\mathbb{E}[\epsilon_i\,D_i]=0$ e indicar los dos posibles valores de $D_i$ $d_1$ $d_2$ . El uso de los dos supuestos y de la descomposición de la $D_i=d_1,D_i=d_2$ , obtenemos $\begin{equation} \begin{cases} \mathbb{P}(D_i=d_1)\,\mathbb{E}(\epsilon_i \mid D_i = d_1) + \mathbb{P}(D_i=d_2)\,\mathbb{E}(\epsilon_i \mid D_i = d_2) = 0 \\ \mathbb{P}(D_i=d_1)\,\mathbb{E}(\epsilon_i \mid D_i = d_1)\,d_1 + \mathbb{P}(D_i=d_2)\,\mathbb{E}(\epsilon_i \mid D_i = d_2)\,d_2 = 0 \end{casos} \end{equation}$

Resolviendo este sistema de ecuaciones para $\mathbb{P}(D_i=d_1)\,\mathbb{E}(\epsilon_i \mid D_i = d_1)$ $\mathbb{P}(D_i=d_2)\,\mathbb{E}(\epsilon_i \mid D_i = d_2)$ , vemos que cualquiera de

$d_1=d_2$ o
$\mathbb{P}(D_i=d_1)\,\mathbb{E}(\epsilon_i \mid D_i = d_1) = \mathbb{P}(D_i=d_2)\,\mathbb{E}(\epsilon_i \mid D_i = d_2)=0$

El primer caso significaría $D_i$ tiene sólo un valor posible (y la media de independencia es trivialmente). Suponiendo que ambas probabilidades $\mathbb{P}(D_i=d_k)>0$ *, el segundo caso implica entonces $\mathbb{E}(\epsilon_i \mid D_i = d_{k} )=0$ , es decir, la media de la independencia. Así, la media de la independencia se sigue de la hipótesis.

*Si una de las probabilidades es $0$ , el correspondiente $\mathbb{E}(\epsilon_i \mid D_i = d_k)$ técnicamente puede obtener cualquier valor, pero entonces el modelo correspondería a $D_i$ tener sólo uno de los posibles valores.

Respondido el 23 de Agosto, 2016 por SHU (18 Puntos )

Independencia de medio de entendimiento en el ajuste de regresión

Respuesta

Prueba

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Independencia de medio de entendimiento en el ajuste de regresión

Respuesta

Prueba

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: