30 votos

Consecuencias de la desigualdad de correlación gaussiana para el cálculo de intervalos de confianza conjuntos

Según este interesante artículo de la revista Quanta: "Una prueba largamente buscada, encontrada y casi perdida" se ha demostrado que dado un vector $\mathbf{x}=(x_1,\dots,x_n)$ que tiene una distribución gaussiana multivariante, y dados los intervalos $I_1,\dots,I_n $ centrados en las medias de los correspondientes componentes de $\mathbf{x}$ entonces

$$p(x_1\in I_1, \dots, x_n\in I_n)\geq \prod_{i=1}^n p(x_i\in I_i) $$

(desigualdad de correlación gaussiana o GCI; véase https://arxiv.org/pdf/1512.08776.pdf para la formulación más general).

Esto parece muy bonito y sencillo, y el artículo dice que tiene consecuencias para los intervalos de confianza conjuntos. Sin embargo, a mí me parece bastante inútil en ese sentido. Supongamos que estamos estimando parámetros $\theta_1,\dots,\theta_n$ y encontramos estimadores $\hat{\theta_1},\dots,\hat{\theta_n}$ que son (quizás asintóticamente) conjuntamente normales (por ejemplo, el estimador MLE). Entonces, si calculo intervalos de confianza del 95% para cada parámetro, el GCI garantiza que el hipercubo $I_1\times\dots I_n$ es una región de confianza conjunta con una cobertura no inferior a $(0.95)^n $ ...lo cual es una cobertura bastante baja incluso para una $n$ .

Por lo tanto, no parece una forma inteligente de encontrar regiones de confianza conjuntas: la región de confianza habitual para una gaussiana multivariante, es decir, un hiperelipsoide, no es difícil de encontrar si se conoce la matriz de covarianza y es más nítida. ¿Tal vez podría ser útil encontrar regiones de confianza cuando la matriz de covarianza es desconocida? ¿Puede mostrarme un ejemplo de la relevancia de la ICG para el cálculo de las regiones de confianza conjuntas?

2 votos

Tienes razón. Los intervalos de confianza individuales deben ser muy superiores al 95% para que la región conjunta alcance el 95%. Cada uno debe ser al menos 0,95 elevado a la potencia 1/n.

1 votos

Una pequeña pero importante corrección: Los intervalos $I_k$ deben estar todos centrados alrededor de cero, es decir. $I_k=\{x: |x|\leq x_k\}$ .

0 votos

@AlexR. Gracias por la corrección. Pero creo que te refieres a centrado en la media de cada componente, ¿no? Que se corresponde con lo que decías si la media de $\mathbf {x}$ es cero.

2voto

MVCylon Puntos 194

Creo que la pregunta es más bien relevante. En cierto sentido, usted está mirando a la prueba de hipótesis múltiple y la comparación con la ejecución de múltiples pruebas de hipótesis.

Sí, efectivamente existe un límite inferior que es el producto de los valores p de las pruebas que suponen independencia. Esta es la base de los ajustes de los valores p en las pruebas multihipótesis, como los ajustes de Bonferroni o Holm. Pero los ajustes de Bonferroni y Holm (asumiendo la independencia) son pruebas de potencia particularmente baja.

Se puede hacer mucho mejor en la práctica (y esto se hace a través de Bootstrap, véase, por ejemplo, Bootstrap Reality Check de H. White, los artículos de Romano-Wolf y el conjunto más reciente de artículos sobre los conjuntos de confianza del modelo). Cada uno de ellos es un intento de realizar una prueba de hipótesis de mayor potencia (por ejemplo, utilizando la correlación estimada para hacerlo mejor que simplemente utilizando este límite inferior) y, en consecuencia, mucho más relevante.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X