Supongamos que dos predictores tienen un fuerte efecto en la respuesta, pero están altamente correlacionados en la muestra de la que se puede construir el modelo. Si se le cae uno de la modelo no predicen bien para las muestras de poblaciones similares en los que los predictores no están altamente correlacionados.
Si usted desea mejorar la precisión de su coeficiente de estimaciones en la presencia de multicolinealidad se introduce un poco de sesgo, fuera de ajuste por una mayor reducción de la varianza. Una forma es mediante la eliminación de los predictores del todo con LAZO, o, en los viejos tiempos, los métodos por pasos—, que es la configuración de sus coeficientes estimados a cero. Otra es por la polarización de todas las estimaciones un poco—con cresta de regresión, o, en los viejos tiempos, la regresión en los primeros componentes principales. Un inconveniente de la antigua es que es muy insegura de si el modelo será utilizado para predecir la respuesta para predictor patrones lejos de los que ocurrieron en la muestra original, como predictores tienden a obtener excluidos simplemente porque no son de mucho uso , junto con otros, casi colineales, los predictores. (No es que la extrapolación es totalmente seguro.) La red elástica es una mezcla de los dos, como @user12436 explica, y tiende a mantener a los grupos de correlación predictores en el modelo.