He estado leyendo más sobre la regresión lineal y las suposiciones que hace. ¿Cuáles son las consecuencias de violar algunas de las suposiciones implicadas?
Por ejemplo, necesita que el conjunto de datos presente poca o ninguna multicolinealidad. ¿Qué ocurre si ignoro esto?
Por ejemplo, supongamos que tengo un conjunto de datos en el que x_3
y x_4
son simplemente duplicados uno del otro (y por lo tanto perfectamente correlacionados). La única diferencia que veo es que, en lugar de tener una línea de mejor ajuste, ahora puedo tener infinitas:
Por ejemplo, si la línea de mejor ajuste sin x_4
tenía Bx_3
en él, entonces puedo simplemente distribuir B
en x_3
y x_4
. Así que si B = 5
Podría hacer 4x_3 + x_4
o 3.5x_3 + 1.5x_4
etc.
Así que, parece que:
1) ¿Tal vez no sea desastroso violar el supuesto de multicolinealidad?
2) ¿Es mucho peor violar a los demás / si es así, cuáles son las consecuencias de hacerlo?
Gracias.