Me he encontrado con muchos supuestos asociados a la regresión lineal (especialmente a la regresión por mínimos cuadrados ordinarios) que son falsos o innecesarios. Por ejemplo:
- las variables independientes deben tener una distribución gaussiana
- los valores atípicos son los puntos que están por encima o por debajo de los bigotes superiores o inferiores correspondientes (empleando la terminología del Boxplot)
- y que el único objetivo de las transformaciones es acercar una distribución a la normalidad para adaptarla al modelo.
Me gustaría saber cuáles son los mitos que se suelen tomar por hechos/supuestos sobre la regresión lineal, especialmente en lo que respecta a las transformaciones no lineales asociadas y a los supuestos de distribución. ¿Cómo surgieron estos mitos?