¿Cómo puedo razonar sobre la selección de variables de comparación/contraste entre
- LASSO
- ejecutar una regresión multivariante estándar y fijar las betas en cero si el valor p es > 0,05
?
¿Cómo puedo razonar sobre la selección de variables de comparación/contraste entre
?
La respuesta es la siguiente: no debes, bajo ninguna circunstancia, hacer lo segundo.
Los estadísticos llevan décadas llorando y gritando a los científicos. Este no es un uso apropiado de los valores p. Un valor p no significativo no no significa que no hay ningún efecto. Lo único que significa es que no se ha rechazado la hipótesis nula.
Además, la regresión por pasos invalida los valores p y crea intervalos de confianza incoherentes, a menos que se tenga en cuenta el proceso de construcción del modelo.
LASSO es diferente. LASSO intentará identificar automáticamente los coeficientes inútiles y los pondrá a 0, cuando sea apropiado. Utilice LASSO y no la regresión por pasos (en la que los coeficientes se ponen a 0 si no son significativos). También puede utilizar la regresión ridge, o un modelo bayesiano.
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.