Parte del problema es que la definición frecuentista de una probabilidad no permite aplicar una probabilidad no trivial al resultado de un experimento concreto, sino sólo a una población ficticia de experimentos de la que este experimento concreto puede considerarse una muestra. La definición de IC es confusa, ya que se trata de una afirmación sobre esta población ficticia de experimentos (normalmente), y no sobre los datos concretos recogidos en el caso en cuestión. Por lo tanto, parte de la cuestión es la definición de una probabilidad: La idea de que el valor verdadero se encuentre dentro de un intervalo concreto con una probabilidad del 95% no es coherente con el marco frecuentista.
Otro aspecto de la cuestión es que el cálculo de la confianza frecuencial no utiliza toda la información contenida en la muestra particular relevante para acotar el valor verdadero de la estadística. Mi pregunta "¿Hay algún ejemplo en el que los intervalos de confianza bayesianos sean obviamente inferiores a los frecuentistas?" discute un artículo de Edwin Jaynes que tiene algunos ejemplos realmente buenos que destacan la diferencia entre los intervalos de confianza y los intervalos creíbles. Uno que es especialmente relevante para esta discusión es el ejemplo 5, que trata de la diferencia entre un intervalo creíble y un intervalo de confianza para estimar el parámetro de una distribución exponencial truncada (para un problema de control de calidad industrial). En el ejemplo que da, hay suficiente información en la muestra para ser ciertos que el verdadero valor del parámetro no se encuentra en ninguna parte de un intervalo de confianza del 90% correctamente construido.
Esto puede parecer chocante para algunos, pero la razón de este resultado es que los intervalos de confianza y los intervalos creíbles son respuestas a dos preguntas diferentes, a partir de dos interpretaciones distintas de la probabilidad.
El intervalo de confianza es la respuesta a la petición: "Deme un intervalo que ponga entre paréntesis el valor verdadero del parámetro en $100p$ % de los casos de un experimento que se repite un gran número de veces". El intervalo creíble es una respuesta a la petición "Dame un intervalo que ponga entre paréntesis el valor verdadero con probabilidad $p$ dada la muestra particular que he observado. " Para poder responder a esta última petición, debemos adoptar primero (a) un nuevo concepto del proceso de generación de datos o (b) un concepto diferente de la propia definición de probabilidad.
La razón principal por la que cualquier intervalo de confianza del 95% no implica una probabilidad del 95% de contener la media es porque el intervalo de confianza es una respuesta a una pregunta diferente, por lo que sólo es la respuesta correcta cuando la respuesta a las dos preguntas resulta tener la misma solución numérica.
En resumen, los intervalos de credibilidad y de confianza responden a diferentes preguntas desde distintas perspectivas; ambos son útiles, pero hay que elegir el intervalo adecuado para la pregunta que realmente se quiere formular. Si quiere un intervalo que admita una interpretación de un 95% (posterior) de probabilidad de contener el valor verdadero, entonces elija un intervalo creíble (y, con él, la conceptualización de probabilidad que conlleva), no un intervalo de confianza. Lo que no debe hacer es adoptar en la interpretación una definición de probabilidad diferente a la utilizada en el análisis.
Gracias a @cardinal por sus mejoras.
He aquí un ejemplo concreto, extraído del excelente libro de David MaKay "Teoría de la información, inferencia y algoritmos de aprendizaje" (página 464):
Sea el parámetro de interés $\theta$ y los datos $D$ un par de puntos $x_1$ y $x_2$ extraídos independientemente de la siguiente distribución:
$p(x|\theta) = \left\{\begin{array}{cl} 1/2 & x = \theta,\\1/2 & x = \theta + 1, \\ 0 & \mathrm{otherwise}\end{array}\right.$
Si $\theta$ es $39$ entonces esperaríamos ver los conjuntos de datos $(39,39)$ , $(39,40)$ , $(40,39)$ y $(40,40)$ todos con la misma probabilidad $1/4$ . Considere el intervalo de confianza
$[\theta_\mathrm{min}(D),\theta_\mathrm{max}(D)] = [\mathrm{min}(x_1,x_2), \mathrm{max}(x_1,x_2)]$ .
Es evidente que se trata de un intervalo de confianza válido del 75%, ya que si se vuelven a muestrear los datos $D = (x_1,x_2)$ Muchas veces, entonces el intervalo de confianza construido de esta manera contendría el valor verdadero el 75% de las veces.
Ahora considere los datos $D = (29,29)$ . En este caso, el intervalo de confianza frecuentista del 75% sería $[29, 29]$ . Sin embargo, suponiendo que el modelo del proceso de generación sea correcto, $\theta$ podría ser 28 o 29 en este caso, y no tenemos ninguna razón para suponer que 29 es más probable que 28, por lo que la probabilidad posterior es $p(\theta=28|D) = p(\theta=29|D) = 1/2$ . Por lo tanto, en este caso el intervalo de confianza frecuentista no es claramente un intervalo creíble del 75%, ya que sólo hay un 50% de probabilidad de que contenga el verdadero valor de $\theta$ , dado lo que podemos inferir sobre $\theta$ de esta muestra en particular .
Sí, se trata de un ejemplo artificial, pero si los intervalos de confianza y los intervalos creíbles no fueran diferentes, seguirían siendo idénticos en los ejemplos artificiales.
Tenga en cuenta que la diferencia clave es que el intervalo de confianza es una afirmación sobre lo que ocurriría si se repitiera el experimento muchas veces, el intervalo de credibilidad es una afirmación sobre lo que se puede inferir de esta muestra en particular.
5 votos
Por "azar", ¿se refiere a la "probabilidad" en el sentido técnico frecuentista, o en el sentido bayesiano de verosimilitud subjetiva? En el sentido frecuentista, sólo los sucesos de los experimentos aleatorios tienen una probabilidad. Observar tres números dados (fijos) (media verdadera, límites calculados del IC) para determinar su orden (¿media verdadera contenida en el IC?) no es un experimento aleatorio. Por eso también es errónea la parte de la probabilidad de "el IC realmente calculado contiene la media de la población o no la contiene, por lo que su probabilidad es 1 o 0". Un modelo de probabilidad frecuentista simplemente no se aplica en ese caso.
20 votos
Depende de cómo se trate la media teórica. Si es una variable aleatoria, se puede decir sobre la probabilidad de que caiga en algún intervalo. Si es constante, no se puede. Esta es la explicación más simple, que cerró esta cuestión para mí personalmente.
3 votos
Por cierto, me encontré con esta charla, de Thaddeus Tarpey: Todos los modelos son correctos la mayoría son inútiles . Discutió la cuestión de la probabilidad de que un intervalo de confianza del 95 % contenga $\mu$ (p. 81 y ss.)?
0 votos
Está muy de acuerdo: "su probabilidad es 1 o 0" no es una forma natural de ver la probabilidad. La probabilidad se mide de otra manera, teniendo en cuenta tus conocimientos (subjetivos); la probabilidad no tiene nunca sentido como verdad objetiva y universal. La probabilidad de que la moneda salga cara es diferente para ti y para tu amigo que ha mirado.
1 votos
Mike: Sólo quería comentar para dar las gracias por la pregunta. Yo también he utilizado la afirmación "su probabilidad es 1 o 0" pero ahora veo, gracias a tu pregunta, a las respuestas y a los comentarios que es engañoso. stats.stackexchange seguramente ha mejorado mis conocimientos sobre estadística gracias a los usuarios que hacen preguntas y respuestas interesantes como las tuyas.
5 votos
@Nesp: No creo que haya ningún problema con la afirmación "Su probabilidad es cero o uno" en referencia a la probabilidad (posterior) de que un IC contenga un parámetro (fijo). (Esto ni siquiera realmente se basa en ninguna interpretación frecuentista de la probabilidad). Tampoco se basa en "estados desconocidos". Esa afirmación se refiere precisamente a la situación en la que se entrega un IC basado en una muestra concreta. Es un ejercicio matemático sencillo demostrar que cualquier probabilidad de este tipo es trivial, es decir, toma valores en $\{0,1\}$ .
1 votos
@cardinal Sí, como dices, yo tampoco veo el problema. Sin embargo (y quizás ahí falló mi inglés) pretendía decir que puede ser engañoso si no se explica adecuadamente (por ejemplo, utilizando el teorema de Bayes) :-).
2 votos
Los lectores interesados también pueden ver este hilo: ¿Qué es exactamente un intervalo de confianza?
2 votos
También es posible que (los lectores interesados) deseen consultar 0 y 1 no son probabilidades.
4 votos
@MikeLawrence tres años después, ¿estás contento con la definición de un intervalo de confianza del 95% como este: "si muestreamos repetidamente de la población y calculamos un intervalo de confianza del 95% después de cada muestra, el 95% de nuestro intervalo de confianza contendría la media". Al igual que tú en 2012, me cuesta ver cómo esto no implica que un intervalo de confianza del 95% tiene una probabilidad del 95% de contener la media. Me interesaría ver cómo ha progresado tu comprensión de un intervalo de confianza desde que hiciste esta pregunta.
1 votos
Tenía la misma pregunta que MikeLawrence. Tengo mi propia respuesta para este problema. En lugar de decir: hay un 95% de posibilidades de que la media esté dentro del IC se podría decir: hay un 95% de posibilidades de que el intervalo de confianza incluya el valor real . De este modo, asigno una probabilidad al IC y no a la media real. ¿Puede alguien confirmar mi afirmación?
1 votos
He encontrado este enlace Ese intervalo de confianza es una variable aleatoria lo que explica que no se pueda asignar una probabilidad a la media (media verdadera). @caracal: La IC es la realización de un experimento aleatorio es decir, no es fija como afirmas en tu comentario.