"Y debe ser distribuido normalmente'
debe?
En los casos que usted menciona es descuidado lenguaje (abreviar "el error en Y debe ser normalmente distribuida"), pero que en realidad no (fuertemente) decir que la respuesta debe ser distribuido normalmente, o al menos no me parece que sus palabras fueron pensados como eso.
El Penn State material del curso
habla de "una variable continua $Y$", pero también sobre "$Y_i$" como en $$E(Y_i) = \beta_0 + \beta_1 x_i$$ where we could regard $Y_i$, que es como la ameba llamado en los comentarios 'condicional', normalmente distribuidas,
$$Y_i \sim N(\beta_0 + \beta_1x_i,\sigma^2)$$
El artículo utiliza $Y$ $Y_i$ indistintamente. En todo el artículo se habla de la distribución de Y', por ejemplo:
sin embargo, en algún otro punto que también se refieren a $Y_i$ en lugar de $Y$:
La variable dependiente $Y_i$ NO necesita ser distribuido normalmente, pero normalmente se asume una distribución de un aumento exponencial de la familia (por ejemplo, binomial, Poisson, multinomial, normal,...)
El statisticssolutions página web
es un muy breve, simplificada, estilizada descripción. No estoy seguro de que usted debe tomar esto en serio. Por ejemplo, se habla de
..requiere que todas las variables a ser multivariante normal...
así que no es sólo la variable de respuesta,
y también el de la 'multivariante descriptor es vaga. No estoy seguro
cómo conseguir que la interpreta.
El artículo de la wikipedia
tiene un adicional de contexto se explica en paréntesis:
Ordinario de regresión lineal predice que el valor esperado de una determinada
cantidad desconocida (la variable de respuesta, una variable aleatoria) como un
combinación lineal de un conjunto de valores observados (predictores). Este
implica que un cambio constante en un predictor conduce a una constante
el cambio en la variable de respuesta (es decir, lineal-modelo de respuesta).
Esto es apropiado cuando la variable de respuesta tiene un normal
distribución (intuitivamente, cuando una variable de respuesta puede variar
esencialmente indefinidamente en cualquier dirección sin "cero
valor", o más en general, para cualquier cantidad que sólo varía en un
cantidad relativamente pequeña, por ejemplo, humanos alturas).
Este 'no se ha fijado un valor cero', parece a punto para el caso de que una combinación lineal $y+\epsilon$ al $\epsilon \sim N(0,\sigma)$ tiene un infinito de dominio (desde menos infinito a más infinito), mientras que a menudo muchas variables tienen algunos finito valor de corte (ya que se cuenta no permite valores negativos).
La línea en particular se ha añadido el 8 de Marzo de 2012, pero tenga en cuenta que la primera línea del artículo de Wikipedia todavía se lee "flexible generalización de ordinario la regresión lineal que permite la respuesta de las variables que han de error de los modelos de distribución de otros de una distribución normal" y no es tanto (no en todas partes) mal.
Conclusión
Así que, basándose en estos tres ejemplos (que de hecho podría generar malentendidos, o al menos podría ser interpretado) yo no diría que "este error se ha extendido". O por lo menos no me parece que la intención de estos tres ejemplos es argumentar que debe ser distribuido normalmente (aunque sí recuerdo que este problema ha surgido antes de aquí en stackexchange, el intercambio entre la distribución normal de los errores y se distribuye normalmente variable de respuesta es fácil hacer).
Así, la idea de que "debe ser normalmente distribuida" me parece no como una generalizada creer/error de concepto (como en algo que se extiende como un arenque rojo), pero más como un error común (que no es la propagación , pero realizadas de forma independiente cada vez).