17 votos

¿Por regresión lineal tiene Asunción en modelo lineal generalizado pero residual tiene supuestos sobre la respuesta?

¿Por qué la regresión lineal y Generalizada de un Modelo de hipótesis inconsistentes?

  • En la regresión lineal, asumimos residual viene de Gauss
  • En otras regresión (regresión logística, el veneno de regresión), asumimos que la respuesta viene en forma de algún distribución binomial, poission etc.).

Por qué a veces supone residual y otra vez asumir en la respuesta? Es porque queremos derivar diferentes propiedades?


EDIT: creo que mark999 muestra de dos formas son iguales. Sin embargo, tengo una duda sobre el yo.yo.d:

Mi otra pregunta, Hay yo.yo.d. hipótesis en la regresión logística? muestra modelo lineal generalizado no tengo.yo.d asunción (independiente, pero no idénticos)

Es cierto que para la regresión lineal, si nos planteamos las hipótesis sobre residual, vamos a tener yo.yo.d, pero si nos planteamos las hipótesis sobre la respuesta, tendremos independiente, pero no idénticas muestras (diferentes de Gauss con diferentes $\mu$)?

14voto

Valentin Rocher Puntos 121

Los supuestos no son incompatibles. Si, por $i = 1, \ldots, n$, usted asume $$ Y_i = \beta_0 + \beta_1 X_{i1} + \ldots + \beta_k X_{ik} + \epsilon_i, $$ con los errores de $\epsilon_i$ está distribuido normalmente con media 0 y varianza $\sigma^2$, que es el mismo que pensar que el condicional en $X_{i1}, \ldots, X_{ik}$, la respuesta $Y_i$ se distribuye normalmente con una media de $\beta_0 + \beta_1 X_{i1} + \ldots + \beta_k X_{ik}$ y de la varianza $\sigma^2$.

Esto es porque acondicionado en $X_{i1}, \ldots, X_{ik}$, tratamos $\beta_0 + \beta_1 X_{i1} + \ldots + \beta_k X_{ik}$ como ser constante.

El habitual modelo de regresión lineal múltiple con el normal de los errores es un modelo lineal generalizado con respuesta normal y la identidad de enlace.

14voto

Cliff AB Puntos 3213

Regresión lineal Simple ha de Gauss errores como un buen atributo que no generalizar a generalizar modelos lineales.

En generalizar modelos lineales, la respuesta sigue alguna distribución dada, dada la media. Regresión lineal de la siguiente manera; si tenemos

$y_i = \beta_0 + \beta_1 x_i + \epsilon_i$

con $\epsilon_i \sim N(0, \sigma)$

luego también tenemos

$y_i \sim N(\beta_0 + \beta_1 x_i, \sigma)$

Bueno, la respuesta sigue a la distribución dada por los modelos lineales generalizados, pero para la regresión lineal nosotros también tenemos que los residuos siguen una distribución Gaussiana. ¿Por qué se hizo hincapié en que los residuos son normales cuando esa no es la generalización de la regla? Bien, porque es mucho más útil la regla. La cosa agradable sobre el pensamiento acerca de la normalidad de los residuos es que esto es mucho más fácil de examinar. Si restamos a cabo la estimación de medias, todos los residuos deben tener aproximadamente la misma varianza y aproximadamente la misma media (0) y serán, aproximadamente, distribuido normalmente (nota: yo digo "casi" porque si no tenemos el perfecto estimaciones de los parámetros de regresión, que por supuesto que no, la varianza de las estimaciones de $\epsilon_i$ tienen diferentes variaciones basado en los rangos de $x$. Pero esperemos que no la suficiente precisión en las estimaciones que este es ignorable!).

Por otro lado, mirando a la ajustadas $y_i$'s, que realmente no podemos saber si son normales si todos ellos tienen diferentes medios. Por ejemplo, considere el siguiente modelo:

$y_i = 0 + 2 \times x_i + \epsilon_i$

con $\epsilon_i \sim N(0, 0.2)$ $x_i \sim \text{Bernoulli}(p = 0.5)$

A continuación, el $y_i$ será muy bimodal, pero no violan los supuestos de la regresión lineal! Por otro lado, los residuos se siguen aproximadamente una distribución normal.

He aquí algunos R código para ilustrar.

x <- rbinom(1000, size = 1, prob = 0.5)
y <- 2 * x + rnorm(1000, sd = 0.2)
fit <- lm(y ~ x)
resids <- residuals(fit)
par(mfrow = c(1,2))
hist(y, main = 'Distribution of Responses')
hist(resids, main = 'Distribution of Residuals')

histograms

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X