Estoy utilizando el paquete R penalizado para obtener el encogimiento de las estimaciones de los coeficientes para un conjunto de datos donde tengo un montón de predictores y poco conocimiento de cuáles son importantes. Después de que he elegido parámetros de ajuste de la L1 y la L2, y estoy satisfecho con mi coeficientes, es que hay una diferencia estadísticamente sonido manera de resumir el ajuste del modelo con algo como R-cuadrado?
Además, estoy interesado en la prueba de la importancia global del modelo (es decir, R2=0, o hacer todas las =0).
He leído a través de las respuestas en una pregunta similar preguntó aquí, pero no acababa de responder a mi pregunta. Hay un excelente tutorial sobre el paquete de R que estoy usando aquí, y el autor Jelle Goeman tenía la siguiente nota al final del tutorial con respecto a los intervalos de confianza de penalizada modelos de regresión:
Es una pregunta natural para los errores estándar de los coeficientes de regresión o de otras cantidades estimadas. En principio los errores estándar se puede calcular fácilmente, por ejemplo, utilizando el bootstrap.
Aún así, este paquete deliberadamente no les proporcionan. La razón de esto es que los errores estándar no son muy significativas para fuertemente estimaciones sesgadas tal como surgen de la penalizado métodos de estimación. Penalizado estimación es un procedimiento que reduce la varianza de los estimadores mediante la introducción de sesgo sustancial. El sesgo de cada estimador es, por tanto, un componente importante de su error cuadrático medio, mientras que su variación puede contribuir sólo una pequeña parte.
Por desgracia, en la mayoría de las aplicaciones de penalizada de regresión es imposible obtener una estimación suficientemente precisa de la tendencia. Cualquier arranque basado en cal - culations sólo puede dar una evaluación de la varianza de las estimaciones. Estimaciones fiables de los sesgos sólo están disponibles si es fiable, imparcial se dispone de estimaciones, que no suele ser el caso en las situaciones en las que penaliza se utilizan las estimaciones.
Informar de un error estándar de un penalizado estimar, por tanto, sólo cuenta parte de la historia. Se puede dar una impresión errónea de gran precisión, ignorando por completo la imprecisión causada por el sesgo. Sin duda es un error hacer de la confianza de las declaraciones que sólo se basan en una evaluación de la varianza de las estimaciones, tales como arranque basado en los intervalos de confianza de hacer.