11 votos

Distribución muestral de los coeficientes de regresión

Yo había aprendido acerca de la distribución de muestras que dieron resultados, que eran para el perito, en términos del parámetro desconocido. Por ejemplo, para el muestreo de las distribuciones de $\hat\beta_0$ $\hat\beta_1$ en el modelo de regresión lineal $Y_i = \beta_o + \beta_1 X_i + \varepsilon_i$

$$ \hat{\beta}_0 \sim \mathcal N \left(\beta_0,~\sigma^2\left(\frac{1}{n}+\frac{\bar{x}^2}{S_{xx}}\right)\right) $$ y $$ \hat{\beta}_1 \sim \mathcal N \left(\beta_1,~\frac{\sigma^2}{S_{xx}}\right) $$

donde $S_{xx} = \sum_{i=1}^n (x_i^2) -n \bar{x}^2$

Pero ahora que he visto lo siguiente en un libro:

Supongamos que el ajuste del modelo por mínimos cuadrados de la forma habitual. Considere la posibilidad de el Bayesiano posterior distribución, y elegir los priores de modo que este es equivalente a la usual frecuentista distribución de muestreo, que es......

$$ \left( \begin{matrix} \beta_0 \\ \beta_1 \end{de la matriz} \right) \sim \mathcal N_2\left[\left(\begin{matrix} \hat{\beta}_1 \\ \hat{\beta}_2 \end{de la matriz} \right),~\hat{\sigma}^2 \left(\begin{matrix} n & \sum_{i=1}^{n}x_i \\ \sum_{i=1}^{n}x_i & \sum_{i=1}^{n}x_i^2 \end{de la matriz} \right) ^{-1}\right] $$

Esto me confunde porque:

  1. ¿Por qué las estimaciones que aparecen en la parte izquierda (lhs) de las 2 primeras expresiones, y el lado derecho (rhs) de la última expresión?
  2. ¿Por qué la beta de sombreros en la última expresión tiene 1 y 2 subíndices en lugar de 0 y 1?
  3. Son solo representaciones diferentes de la misma cosa? Si es así, alguien podría mostrar mi ¿son equivalentes? Si no, podría alguien explicarme la diferencia?
  4. Es el caso de que la última expresión es la "inversión" de los dos primeros? Es esa la razón de que la matriz de 2x2 en la última expresión es invertida y estimaciones de los parámetros/cambia de rhs$\leftrightarrow$lhs? Si es así es posible que alguien me muestre cómo llegar de uno a los otros?

7voto

AdamSane Puntos 1825

Esta parte se refiere principalmente a su primera, tercera y cuarta pregunta:

Hay una diferencia fundamental entre la estadística Bayesiana y estadística frecuentista.

Frecuentista estadísticas de hace inferencia sobre el que se fija valores de los parámetros son consistentes con los datos vistos como al azar, normalmente, a través de la probabilidad. Tome $\theta$ (algún parámetro o parámetros) como fijos, pero desconocido, y ver que hacen los datos más probable, se ve a las propiedades de muestreo a partir de un modelo dado los parámetros para hacer inferencias acerca de los parámetros podría ser. (Un Bayesiano puede decir que el enfoque frecuentista se basa en "las frecuencias de las cosas que no suceden')

La estadística bayesiana se ve en la información acerca de los parámetros en términos de una distribución de probabilidad sobre ellos, que es actualizada por los datos, a través de la probabilidad. Los parámetros de las distribuciones, por lo que ver el $P(\theta|\underline{x})$.

Esto se traduce en cosas que a menudo parecen similares pero en los que las variables en un mismo look "al revés", visto a través del lente de la otra manera de pensar acerca de ello.

Así que, fundamentalmente, son algo diferentes cosas, y el hecho de que las cosas que están en el lado izquierdo de uno están en el lado derecho de la otra no es un accidente.

Si usted trabaje con ambos, pronto se hace razonablemente claro.

La segunda pregunta me parece que se refieren simplemente a un error tipográfico.

---

la declaración de "equivalente a la usual frecuentista distribución de muestreo, que es" : tomé esto significa que los autores declaran la frecuentista distribución de muestreo. He leído esto equivocadamente?

Hay dos cosas que hacer allí - han expresado algo un poco floja (la gente hace este tipo particular de más floja de expresión de todo el tiempo), y creo que usted también lo interpreta de manera diferente de la intención.

¿Qué significa exactamente la expresión que dar decir, entonces ?

Esperemos que el debate va a ayudar a aclarar la intención de sentido.

Si usted puede proporcionar una referencia (pref. en línea, ya que no tienen buen acceso a la biblioteca) donde esta expresión se obtiene lo agradecería.

Sigue a la derecha desde aquí:

http://en.wikipedia.org/wiki/Bayesian_linear_regression

tomando plana priores en $\beta$ y creo que un piso antes de $\sigma^2$.

La razón es que la parte posterior es por lo tanto proporcional a la probabilidad y los intervalos generados a partir de los posteriores en los parámetros coinciden con los frecuencial de los intervalos de confianza para los parámetros.

Usted puede encontrar las primeras páginas aquí de ayuda.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X