¿Por qué es necesario que el número de variables independientes sea menor que el número de puntos de datos en una configuración de regresión? Si suponemos que es al revés, es decir, que el número de variables independientes es mucho mayor que el número de observaciones, ¿cuál debería ser la solución?
Respuesta
¿Demasiados anuncios?Considera uno de los casos más simples posibles. Una variable independiente (así que 2 parámetros, incluyendo la constante). Un punto de datos.
Tracé su punto de datos
Dibuja una línea recta a través de ese punto. Dibuja una línea recta diferente a través del mismo punto. Dibuja una tercera. ... y así sucesivamente.
$\hspace{3cm}$
Todos encajan perfectamente con los datos. ¿Cuál vas a elegir?
El problema es similar con dos puntos y dos predictores (con un plano a través de dos puntos es un poco como tratar de apoyar una lámina de madera contrachapada en la parte superior de una valla de piquete - estable en una dirección, pero es un sube y baja en la otra).