5 votos

El valor esperado de p y dado, es el promedio ponderado de decir q y y y

Se supone que:

1) $y=q+u$

Donde $q$ es de la productividad y $y$ un testscore que mide la verdadera productividad. $u$ es distribuido normalmente término de error, independiente de $q$, con cero de media y varianza constante; $q$ también se supone que se distribuye normalmente con una media igual a $\alpha$ y con una varianza constante. El resultado de esto es:

2) $E(q | y) = (1-\gamma)\alpha + \gamma y$
donde $\gamma=Var(q)/(Var(q)+Var(u))$

¿Cómo se puede obtener la ecuación 2? La ecuación puede ser expresada como un efecto de grupo y un efecto individual.

[Este es un modelo de discriminación estadística, consulte: Dennis J. Aigner y Glen G. Caín. Teorías estadísticas de la discriminación en los mercados laborales. Relaciones industriales y Laborales, Revisión de, 30(2):175{187, de enero de 1977. URL: http:// ideas.repec.org/a/ilr/articl/v30y1977i2p175-187.html.]

6voto

jldugger Puntos 7490

Todo lo que usted necesita saber es que la regresión de $q$ $y$ se determina mediante la estandarización de ambas variables y su coeficiente de correlación será la pendiente.

(En particular, este resultado no debe nada a la hipótesis de que las distribuciones son Normales; la independencia de $q$ $u$ es suficiente. Así será más revelador para obtenerlo sin recurrir a las propiedades de las distribuciones Normales.)


Los Cálculos Preliminares

Para estandarizar una variable, se resta su expectativa y dividir por su desviación estándar. Por lo tanto, a la necesidad de calcular las desviaciones estándar, las expectativas, y un coeficiente de correlación.

Debido a $y=q+u$,

$$\mathbb{E}(y) = \mathbb{E}(q+u) = \mathbb{E}(q) + \mathbb{E}(u) = \alpha + 0 = \alpha,$$

teniendo cuidado de informática de las expectativas.

Turno ahora para las desviaciones estándar. Recordar que es más sencillo trabajar con sus plazas: las desviaciones. Para mayor brevedad, escribir $\sigma^2$ para la varianza de $q$ $\tau^2$ para la varianza de $u$. Entonces

$$\text{Var}(y) = \text{Var}(q+u) = \text{Var}(q) + \text{Var}(u) + 2\text{Cov}(u,q) = \sigma^2 + \tau^2 + 0 = \sigma^2 + \tau^2.$$

Finalmente, la correlación se calcula a partir de la covarianza:

$$\text{Cov}(y, q) = \text{Cov}(q+u, q) = \text{Cov}(q,q) + \text{Cov}(u,q) = \sigma^2.$$

(Tanto estos cálculos se utiliza la simplificación $\text{Cov}(u,q)=0$ derivadas de la independencia de $u$$q$.)

Por lo tanto, la estandarización de las variables se $$\eta = (y-\alpha)/\sqrt{\sigma^2+\tau^2}$$ and $$\theta=(q-\alpha)/\sigma.$$

Por otra parte, la correlación es $$\rho=\sigma^2/\left(\sigma\sqrt{\sigma^2+\tau^2}\right) = \sigma / \sqrt{\sigma^2+\tau^2}.$$


Solución

Hemos calculado todo lo necesario para retroceder $q$ contra $y$:

$$\mathbb{E}(\theta\ |\ \eta) = \rho\, \eta.$$

(Este es un hecho acerca de la geometría, en realidad: ver a las "Conclusiones" de la sección en http://stats.stackexchange.com/a/71303 para la derivación, que-aunque se ilustra allí para distribuciones Normales, no requiere la Normalidad a derivar.)

En expansión, y una vez más la explotación de la linealidad de la espera,

$$\frac{\mathbb{E}(q\ |\ y)-\alpha}{\sigma} = \mathbb{E}(\theta\ |\ \eta) = \rho\, \eta = \frac{\sigma}{\sqrt{\sigma^2+\tau^2}}\left(\frac{y-\alpha}{\sqrt{\sigma^2+\tau^2}}\right) = \frac{\sigma(y-\alpha)}{\sigma^2+\tau^2}.$$

Es la tarea de ordinario álgebra para convertir esto en una expresión para $\mathbb{E}(q\ |\ y)$ en términos de $y$, debido a que, en la medida de lo $\mathbb{E}(q\ |\ y)$) de todas las variables representan números:

$$\mathbb{E}(q\ |\ y) = \frac{\tau^2}{\sigma^2+\tau^2} \alpha + \frac{\sigma^2}{\sigma^2+\tau^2} y.$$

Que es la Ecuación (2). Echar una mirada sobre los cálculos deben aliviar cualquier misterio acerca de dónde estos coeficientes de vino o lo que significan.

3voto

bessman Puntos 2514

El modelo implica que $y\sim\mathcal{N}(q,\sigma^2_u)$$q\sim\mathcal{N}(a,\sigma^2_q)$. Por la regla de Bayes: $$p(q\mid y)\propto p(y\mid q,\sigma^2_u)p(q)$$ Ignorando factores constantes (ver aquí para un desarrollo similar): $$\begin{align}p(q\mid y) & \propto \exp\left\{-\frac{(y-q)^2}{2\sigma^2_u}-\frac{(q-a)^2}{\sigma^2_q}\right\}\\ &=\exp\left\{-\frac{1}{2}\left(\frac{y^2-2yq+q^2}{\sigma^2_u}+\frac{q^2-2qa+a^2}{\sigma^2_q}\right)\right\}\end{align}$$ cualquier término que no incluye a $q$ puede ser visto como una constante de proporcionalidad: $$\begin{align}\qquad\qquad\qquad &\propto\exp\left\{-\frac{1}{2}\frac{-2\sigma^2_q yq+\sigma^2_q q^2+\sigma^2_u q^2-2\sigma^2_u qa}{\sigma^2_u\sigma^2_q}\right\}\\ &=\exp\left\{-\frac{1}{2}\frac{(\sigma^2_q+\sigma^2_u)q^2-2(\sigma^2_u a+\sigma^2_q y)q}{\sigma^2_u\sigma^2_q}\right\}\\ &=\exp\left\{-\frac{1}{2}\frac{q^2-2q\frac{\sigma^2_u a+\sigma^2_q y}{\sigma^2_q+\sigma^2_u}}{\frac{\sigma^2_q\sigma^2_u}{\sigma^2_q+\sigma^2_u}}\right\}\propto \exp\left\{-\frac{1}{2}\frac{\left(q-\frac{\sigma^2_u a+\sigma^2_q y}{\sigma^2_q+\sigma^2_u}\right)^2}{\frac{\sigma^2_q\sigma^2_u}{\sigma^2_q+\sigma^2_u}}\right\}\end{align}$$ Por lo tanto: $$E(q\mid y)=\frac{\sigma^2_u un+\sigma^2_q y}{\sigma^2_q+\sigma^2_u} =\left(1-\frac{\sigma^2_q}{\sigma^2_q+\sigma^2_u}\right)a+\frac{\sigma^2_q}{\sigma^2_q+\sigma^2_u}y$$

2voto

bessman Puntos 2514

De otra manera, es la más corta ;-)

En general, si $X$ $Y$ tienen una distribución normal bivariante, entonces (Anderson, Teorema 2.5.1): $$E[X\a mediados de Y]=E[X]+\frac{\text{Cov}(X,Y)}{V[Y]}(Y-E[X]) =\left(1-\frac{\text{Cov}(X,Y)}{V[Y]}\right)E[X]+\frac{\text{Cov}(X,Y)}{V[Y]}$Y$ es decir, "valor esperado de X dado que Y es el promedio ponderado de la media de X y de y" es un resultado conocido.

En su modelo $E[q]=a$, $V[y]=\sigma^2_q+\sigma^2_u$ y $\text{Cov}(y,q)=\sigma^2_q$ (ver whubner la respuesta), así: $$E[q\mid y]=a+\frac{\sigma^2_q}{\sigma^2_q+\sigma^2_u}(y-a)= \left(1-\frac{\sigma^2_q}{\sigma^2_q+\sigma^2_u}\right)+\frac{\sigma^2_q}{\sigma^2_q+\sigma^2_u}$y$

0voto

CloseToC Puntos 513

Creo que el siguiente argumento muestra por qué, por desgracia, es un desordenado. Mucho más elegante derivaciones son, sin duda que hay en algún lugar como el lineal de Gauss caso es el que se entiende mejor modelo estadístico en la existencia.

De todos modos, tenemos que:

  1. U~N(0, sigma2)

  2. P~N(alfa, beta^2)

  3. Y=Q+U.

  4. U y P son independientes.

Debido a que una función lineal de la normal de variables aleatorias es en sí misma una variable aleatoria normal y debido a la independencia de la U y P se sigue que S | P ~ N(Q+0,sigma2).

Ahora podemos escribir la función de densidad de probabilidad de Q condicionada a Y=Y. Por el teorema de Bayes, que es:

(pdf de veces Q * pdf de S|Q)/(pdf de Y).

No voy a escribir esto porque es muy desordenado con todas las Gaussianas.

Q|Y será una variable aleatoria normal, lo que significa que su modo es su media. Ignorando el denominador (el de la normalización de la constante), nos quedamos con:

1/(2pi*sigma^2*beta^2) * exp(-Algo(Q))

Nos encontramos con el modo de la distribución posterior por la elección de Q, así como para maximizar la densidad. Que va a ser el condicional valor esperado demasiado, porque el es el modo de significar para una Gaussiana. Para ello podemos ignorar todo excepto Algo(Q), porque el resto no es una función de P.

Si usted hace el álgebra, Algo(Q) = 1/2 *( (y-p)^2/sigma^2) + (q-alfa)^2/beta^2)

Si usted diferenciar wrt q, establece en 0 y resolver para q, se obtendrá:

q=beta^2/(beta^2+sigma^2)*y+sigma^2/(beta^2+sigma^2)*alfa... como lo requiere!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X