LAZO de regresión reduce los coeficientes a cero, proporcionando así la eficacia de selección de modelo. Creo que en mis datos hay interacciones significativas entre el valor nominal y continua de las covariables. No necesariamente, sin embargo, son los "efectos principales" de la verdadera modelo significativo (no-cero). Por supuesto, yo no conozco a este ya que el modelo verdadero es desconocido. Mis objetivos son encontrar el verdadero modelo y predecir el resultado tan estrechamente como sea posible.
He aprendido que el enfoque clásico para la construcción de modelos siempre se incluyen un efecto principal antes de una interacción está incluido. Por lo tanto no puede ser un modelo, sin un efecto principal de dos covariables $X$ $Z$ si existe una interacción de las covariables $X*Z$ en el mismo modelo. El step
de la función en R
, en consecuencia selecciona cuidadosamente el modelo de términos (por ejemplo, basada en adelante o atrás AIC) permaneciendo a esta regla.
LASSO parece funcionar de manera diferente. Puesto que todos los parámetros son penalizados puede, sin duda, ocurre que el principal efecto es reducido a cero, mientras que la interacción de los mejores (por ejemplo, validado por cruz) el modelo es distinto de cero. Este encuentro, en particular, para mi de los datos en R
's glmnet
paquete.
He recibido críticas basadas en la primera norma antes citada, es decir, mi final validado por cruz Lasso modelo no incluye el correspondiente efecto principal de los términos de algunos no-cero de la interacción. Sin embargo, esta regla parece un poco extraño en este contexto. Lo que se pretende es la cuestión de si el parámetro en el modelo verdadero es cero. Supongamos que es, pero la interacción no es cero, entonces LAZO identificará esto quizás, así, encontrar el modelo correcto. De hecho, parece que las predicciones de este modelo será más precisa debido a que el modelo no contiene el verdadero cero efecto principal, que es, efectivamente, un ruido variable.
Puedo refutar las críticas basadas en esta tierra o debo tomar precauciones de alguna manera que el LAZO no incluye el efecto principal antes de que el término de interacción?