21 votos

los intervalos de confianza' de la cobertura con estimaciones regularizados

Supongamos que yo estoy tratando de estimar un gran número de parámetros a partir de algunos datos de alta dimensión, el uso de algún tipo de estimaciones regularizados. El regularizer introduce cierto sesgo en las estimaciones, pero todavía puede ser un buen trade-off debido a la reducción en la varianza debe más que compensar por ello.

El problema viene cuando quiero para estimar los intervalos de confianza (por ejemplo, utilizando la aproximación de Laplace o bootstrapping). Específicamente, el sesgo en mis estimaciones conduce a la mala cobertura en mi intervalos de confianza, lo que hace que sea difícil determinar la frecuentista propiedades de mi estimador.

He encontrado algunos documentos de debate sobre este problema (por ejemplo, "Asintótico de los intervalos de confianza en la cresta de regresión basado en el Edgeworth expansión"), pero la matemática es en su mayoría por encima de mi cabeza. En los enlaces de papel, Ecuaciones 92-93 parecen ser un factor de corrección para las estimaciones que fueron regularizados por la cresta de regresión, pero me preguntaba si eran buenos, los procedimientos de trabajo con una gama de diferentes regularizers.

Incluso una de primer orden de la corrección sería extremadamente útil.

4voto

jpmuc Puntos 4817

Hay un reciente documento de direcciones a la que, precisamente, su pregunta (si desea realizar la regresión sobre los datos, como yo lo entiendo) y, por suerte, proporciona expresiones que son fáciles de calcular (Intervalos de Confianza y Pruebas de Hipótesis para la Alta dimensión de la Regresión).

También, usted puede estar interesado en el trabajo reciente de Pedro Bühlmann en ese tema. Pero creo que el primer documento le proporciona lo que usted está buscando, y los contenidos son más fáciles de digerir (no soy un estadístico).

1voto

Ruslan Puntos 111

http://cran.r-project.org/web/packages/hdi/index.html

Es esto lo que estás buscando?

Description
Computes confidence intervals for the l1-norm of groups of regression parameters in a hierarchical
clustering tree.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X