Significa que su matriz de diseño no es invertible y, por lo tanto, no se puede utilizar para desarrollar un modelo de regresión. Esto se debe a columnas linealmente dependientes, es decir, variables fuertemente correlacionadas. Examine la covarianza (o correlación) par a par de sus variables para investigar si hay alguna variable que se pueda eliminar potencialmente. Está buscando covarianzas (o correlaciones) >> 0. Alternativamente, probablemente pueda automatizar esta selección de variables utilizando una regresión paso a paso hacia adelante.
Esto también puede resultar de tener más variables que observaciones, en cuyo caso es probable que su matriz de diseño no sea de rango completo. Esto es un poco más complicado de solucionar, pero hay formas. Creo que la regresión lasso se supone que funciona bien cuando los datos son "más anchos" que "largos".
Tenga en cuenta: si decide probar lasso o selección paso a paso, está haciendo mucho más (en términos de selección de variables) que simplemente manejar la multicolinealidad.
1 votos
Pasé mucho tiempo en este error, pero eché un vistazo a esta página que lo resolvió para mí kaggle.com/c/house-prices-advanced-regression-techniques/… Básicamente, simplemente puedes cambiar el método que utiliza MICE. Yo estaba usando PPN y lo cambié a CART.
1 votos
Tienes multicolinealidad.