Como supuesto de la regresión lineal, la normalidad de la distribución del error a veces se "extiende" erróneamente o se interpreta como la necesidad de normalidad de la y o la x.
¿Es posible construir un escenario/conjunto de datos en el que las X y las Y no sean normales pero el término de error sí lo sea y, por tanto, las estimaciones de regresión lineal obtenidas sean válidas?
5 votos
Ejemplo trivial: X tiene una distribución Bernoulli (es decir, toma los valores 0 ó 1); Y = X + N(0, 0,1). Ni X ni Y se distribuyen normalmente por sí mismos, pero la regresión de Y sobre X sigue funcionando.
0 votos
Supongo que estás pensando en la distribución de los residuos, no en la distribución de las variables.
5 votos
Tengo un ejemplo elaborado aquí: ¿Qué ocurre si los residuos están distribuidos normalmente pero Y no lo está?
0 votos
Relacionado con esto: stats.stackexchange.com/questions/148803/