Según este interesante artículo de la revista Quanta: "Una prueba largamente buscada, encontrada y casi perdida" se ha demostrado que dado un vector $\mathbf{x}=(x_1,\dots,x_n)$ que tiene una distribución gaussiana multivariante, y dados los intervalos $I_1,\dots,I_n $ centrados en las medias de los correspondientes componentes de $\mathbf{x}$ entonces
$$p(x_1\in I_1, \dots, x_n\in I_n)\geq \prod_{i=1}^n p(x_i\in I_i) $$
(desigualdad de correlación gaussiana o GCI; véase https://arxiv.org/pdf/1512.08776.pdf para la formulación más general).
Esto parece muy bonito y sencillo, y el artículo dice que tiene consecuencias para los intervalos de confianza conjuntos. Sin embargo, a mí me parece bastante inútil en ese sentido. Supongamos que estamos estimando parámetros $\theta_1,\dots,\theta_n$ y encontramos estimadores $\hat{\theta_1},\dots,\hat{\theta_n}$ que son (quizás asintóticamente) conjuntamente normales (por ejemplo, el estimador MLE). Entonces, si calculo intervalos de confianza del 95% para cada parámetro, el GCI garantiza que el hipercubo $I_1\times\dots I_n$ es una región de confianza conjunta con una cobertura no inferior a $(0.95)^n $ ...lo cual es una cobertura bastante baja incluso para una $n$ .
Por lo tanto, no parece una forma inteligente de encontrar regiones de confianza conjuntas: la región de confianza habitual para una gaussiana multivariante, es decir, un hiperelipsoide, no es difícil de encontrar si se conoce la matriz de covarianza y es más nítida. ¿Tal vez podría ser útil encontrar regiones de confianza cuando la matriz de covarianza es desconocida? ¿Puede mostrarme un ejemplo de la relevancia de la ICG para el cálculo de las regiones de confianza conjuntas?
2 votos
Tienes razón. Los intervalos de confianza individuales deben ser muy superiores al 95% para que la región conjunta alcance el 95%. Cada uno debe ser al menos 0,95 elevado a la potencia 1/n.
1 votos
Una pequeña pero importante corrección: Los intervalos $I_k$ deben estar todos centrados alrededor de cero, es decir. $I_k=\{x: |x|\leq x_k\}$ .
0 votos
@AlexR. Gracias por la corrección. Pero creo que te refieres a centrado en la media de cada componente, ¿no? Que se corresponde con lo que decías si la media de $\mathbf {x}$ es cero.
0 votos
@DeltaIV: Sí, así que si no me equivoco, GCI siempre asume una distribución centrada en cero (lo que equivale a desplazarse por la media). Y supongo que $x_k=(x_{k1},x_{k2},...)$
0 votos
Hmm, ¿no dice el artículo que GCI es cierto para cualquier polígono convexo? Supongo que el caso especial de un "rectángulo" de alta dimensión descrito en tu pregunta es mucho más sencillo, y la dificultad se debe a la forma arbitraria del polígono sobre el que se toma la integral.
0 votos
@Sycorax DeltaIV pregunta específicamente por los intervalos de confianza. Si está interesado en "por qué la demostración de la ICG es consecuente o importante más allá del hecho de que no se demostró durante mucho tiempo", entonces yo diría que esta es una pregunta para MathOverflow.
0 votos
@amoeba ¿Por qué esa pregunta no sería adecuada para CV?
0 votos
@Sycorax Es adecuado y tiene mi +1. Pero las posibilidades de obtener una buena respuesta podrían ser mayores en otro sitio.
0 votos
@amoeba Gracias por señalarlo. Voy a ver donde va esto y cuando tenga otro excedente de 100 rep por encima de 20k lo vuelvo a intentar.
1 votos
@amoeba No me preocupa la dificultad de la prueba, sino su relevancia para la estadística aplicada. Si considerar un hiperrectángulo facilita la demostración de dicha relevancia, bien. Si por el contrario piensas que esta desigualdad sólo es útil en la práctica cuando se considera un polígono arbitrario, de acuerdo. Aceptaré una respuesta que diga "si consideras sólo hiperrectángulos, la ICG no es una herramienta muy útil para un estadístico aplicado, porque.... Pero si se consideran polígonos arbitrarios, entonces sí es relevante, porque..."
0 votos
@amoeba en otras palabras, no soy estadístico y no pude seguir los detalles de la prueba. Pero el enunciado es muy sencillo y puedo entenderlo. Así que si esto es una herramienta que puedo utilizar en el trabajo diario, me encantaría saber cómo.
0 votos
Ya veo. Es sólo que en la primera frase de tu pregunta estás haciendo una afirmación sobre lo que es la "desigualdad de correlación gaussiana", y creo que esta afirmación no es exacta.
0 votos
@amoeba ok, ¿puedes editarlo para que sea correcto? En el artículo al que me refiero, el ejemplo estadístico que hacen se refiere explícitamente a un hiperrectángulo (bueno, un rectángulo en $\mathbb{R}^2$ El poder de la GCI radica en que es cierta en todos los aspectos. $\mathbb{R}^n$ ). No conozco el enunciado correcto, así que no puedo hacer la corrección yo mismo. O podría decir "un caso especial de la ICG es...".
1 votos
Quería editar y busqué en los documentos con las pruebas, pero ahora ya no estoy 100% seguro de si el hiperrectángulo es un caso especial/fácil o una formulación equivalente. Voy a dejarlo por ahora y tal vez volver aquí más tarde.
0 votos
Leí que el teorema era para conjuntos convexos, y que los rectángulos eran un peldaño en el camino.
1 votos
Los hiperrectángulos centrados en el origen (donde con centrados en el origen quiero decir que cada uno de los intervalos 1D, cuyo producto cartesiano define el hiperrectángulo, es simétrico respecto al origen) son definitivamente al menos un caso especial (no tengo ni idea de si son un caso equivalente). Según el artículo de arXiv, la desigualdad es válida para todos los conjuntos convexos simétricos. Un hiperrectángulo $H$ es un conjunto convexo, y si está centrado en el origen en el sentido definido anteriormente, entonces es simétrico, es decir, $\mathbf{x}=(x_1,\dots,x_n)\in H \iff -\mathbf{x} \in H$ .