Estoy haciendo OLS Post-Lasso, es decir, ejecutando una regresión Lasso en algunos datos, y luego ejecutando una regresión OLS con sólo las variables que tenían coeficientes no nulos al hacer Lasso.
¿Debo preocuparme por la significación estadística en la etapa OLS? Si es así, ¿cómo? Utilizar el umbral estándar de significación estadística me parece un poco conservador, dado que la variable ya fue preseleccionada en la primera etapa por Lasso. Para dar un ejemplo concreto, me siento incómodo diciendo que no hay suficiente evidencia para concluir que hay una correlación simplemente porque un coeficiente tiene un estadístico t de (digamos) 1,5.