1 votos

LASSO frente a la selección estándar de variables mediante el valor p

¿Cómo puedo razonar sobre la selección de variables de comparación/contraste entre

  1. LASSO
  2. ejecutar una regresión multivariante estándar y fijar las betas en cero si el valor p es > 0,05

?

2voto

La respuesta es la siguiente: no debes, bajo ninguna circunstancia, hacer lo segundo.

Los estadísticos llevan décadas llorando y gritando a los científicos. Este no es un uso apropiado de los valores p. Un valor p no significativo no no significa que no hay ningún efecto. Lo único que significa es que no se ha rechazado la hipótesis nula.

Además, la regresión por pasos invalida los valores p y crea intervalos de confianza incoherentes, a menos que se tenga en cuenta el proceso de construcción del modelo.

LASSO es diferente. LASSO intentará identificar automáticamente los coeficientes inútiles y los pondrá a 0, cuando sea apropiado. Utilice LASSO y no la regresión por pasos (en la que los coeficientes se ponen a 0 si no son significativos). También puede utilizar la regresión ridge, o un modelo bayesiano.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X