12 votos

¿Qué expresa realmente un intervalo de confianza (frente a un intervalo creíble)?

Posible duplicado:
¿Qué es exactamente un intervalo de confianza?

Sí, ya se han planteado preguntas similares, pero muchas de las respuestas parecen contradictorias y no abordan mi cuestión. (O mi percepción de la cuestión).

Como se ha mencionado en muchos lugares, lo que la mayoría de la gente encontrará intuitivo cuando se le presente un intervalo y una probabilidad, es que expresa lo probable que es que el valor verdadero se encuentre en este rango. Si se le dice que un sondeo a pie de urna tiene un intervalo de confianza de 60-70 con una probabilidad de 0,95, un profano puede esperar (razonablemente) que cuando los sondeos a pie de urna tengan este resultado, el intervalo incluya realmente la proporción verdadera el 95 % de las veces. Expresado matemáticamente:

$P(X\in[60,70]) = 0.95$

El problema es que esta parece ser la interpretación correcta de intervalos creíbles y una interpretación errónea de los intervalos de confianza. En http://en.wikipedia.org/wiki/Confidence_interval :

Un intervalo de confianza no no predecir que el valor verdadero del parámetro tiene una determinada probabilidad de estar en el intervalo de confianza dados los datos realmente obtenidos.

Entonces, ¿qué significa un intervalo de confianza? La Wikipedia dice:

Un intervalo de confianza con un nivel de confianza determinado pretende dar la seguridad de que, si el modelo estadístico es correcto, entonces, tomado sobre todos los datos que pudieran haberse obtenido, el procedimiento de construcción del intervalo arrojaría un intervalo de confianza que incluiría el valor verdadero del parámetro la proporción del tiempo establecida por el nivel de confianza.

Me parece que la redacción es muy confusa, pero entiendo que significa que, dada cada X, hay al menos una probabilidad de 0,95 de obtener una Y cuyo intervalo abarque X:

$P_X(Y : X \in I_y) \ge 0.95$

Esto parece ser coherente con la explicación de los intervalos de confianza y credibilidad dada por Keith Winstein aquí: ¿Cuál es la diferencia entre un intervalo de confianza y un intervalo creíble? (La probabilidad, dado un tarro de galletas, de escoger una galleta con un recuento de virutas cuyo intervalo abarque ese mismo tarro de galletas es de al menos el 70 %)

Si esta interpretación es correcta, no veo por qué los intervalos de confianza tienen algún sentido práctico. Cada intervalo depende de otros intervalos de forma difícilmente comprensible y, de hecho, no tiene ninguna relación fuerte con el resultado real de un muestreo.

¿Puede alguien explicar por qué este concepto está tan extendido? (Soy consciente de que utilizar la probabilidad bayesiana para obtener el intervalo creíble puede no ser deseable, pero eso no necesariamente hacen de los IC una buena alternativa).

2 votos

El penúltimo párrafo parece especialmente importante: ¿qué utilidad práctica tienen las IC, dado su abstruso significado real?

0 votos

Aunque tal vez esté dispersa entre varias preguntas, creo que su mensaje ya ha sido tratado en este sitio.

0 votos

rolando2, sí, creo que es lo que busco.

9voto

Eero Puntos 1612

Tanto los intervalos de confianza como los intervalos creíbles representan nuestro conocimiento sobre un parámetro desconocido dados los datos y otros supuestos. Cuando se utilizan interpretaciones legas, los dos intervalos son bastante similares (aunque puede que haya hecho que los frecuentistas y los bayesianos tengan un punto en común al sentirse ofendidos por mi afirmación). La parte complicada viene al entrar en las definiciones exactas.

Los bayesianos pueden hablar de la probabilidad de que el parámetro esté en el intervalo, pero tienen que utilizar la definición bayesiana de probabilidad, que es básicamente que la probabilidad representa nuestro conocimiento sobre un parámetro desconocido (¿les resulta familiar?). Tengan en cuenta que yo no soy bayesiano, así que puede que quieran dar una definición mejor que la mía. Esto no funciona si se intenta utilizar una comprensión frecuentista de la probabilidad.

La definición frecuentista de la probabilidad habla de la frecuencia con la que se producirá un resultado si se repite un montón de veces al azar. Una vez que el azar ha terminado, ya no podemos hablar de probabilidad, así que utilizamos el término confianza para representar la idea de la cantidad de incertidumbre después de que el evento haya ocurrido (la confianza frecuentista es similar a la probabilidad bayesiana). Antes de lanzar una moneda, tengo una probabilidad de 0,5 de salir cara, pero después de que la moneda se haya lanzado y haya caído o se haya cogido, o bien sale cara o bien sale cruz, por lo que la probabilidad es del 0% o del 100%, por lo que a los frecuentistas no les gusta decir "probabilidad" después de que la pieza aleatoria haya terminado (los bayesianos no tienen este problema, ya que para ellos la probabilidad representa nuestro conocimiento sobre algo, no la proporción de resultados reales). Antes de recoger la muestra a partir de la cual calcularemos nuestro intervalo de confianza, tenemos un 95% de posibilidades de obtener una muestra que genere un Intervalo de Confianza que contenga el valor verdadero. Pero una vez que tenemos un Intervalo de Confianza, el valor verdadero está dentro de ese intervalo o no lo está, y no cambia.

Imagina que tienes una urna con 95 bolas blancas y 5 negras (o un número total mayor con la misma proporción). Ahora saque una bola completamente al azar y sosténgala en la mano sin mirarla (si le preocupa la incertidumbre cuántica puede pedirle a un amigo que la mire pero que no le diga de qué color es). Ahora tienes una bola blanca o una bola negra en la mano, pero no sabes cuál es. Un bayesiano puede decir que hay un 95% de probabilidades de tener una bola blanca porque su definición de probabilidad representa el conocimiento de que sacaste una bola al azar en la que el 95% era blanca. Los frecuentistas podrían decir que tienen un 95% de confianza en que tienes una bola blanca por el mismo razonamiento, pero ninguno de ellos afirmaría que si abres la mano 100 veces y miras la bola (sin sacar una nueva bola) verás una bola negra unas 5 veces y una blanca unas 95 veces (que es lo que ocurriría si hubiera un 95% de probabilidad frecuentista de tener una bola blanca). Ahora imagine que las bolas blancas representan muestras que llevarían a un CI correcto y las bolas negras representan muestras que no lo harían.

Esto se puede ver a través de la simulación, ya sea utilizando un ordenador para simular los datos de una distribución conocida o utilizando una pequeña población finita en la que se pueda calcular la verdadera media. Si se toma un grupo de muestras y se calculan los intervalos de confianza y los intervalos creíbles para cada muestra, y luego se calcula la media verdadera (u otro parámetro), se verá que aproximadamente el 95% de los intervalos contienen el valor verdadero (si se han utilizado supuestos razonables). Pero si se concentra en un solo intervalo de una sola muestra, o bien contiene el valor verdadero o no lo contiene, y no importa cuánto tiempo mire ese intervalo dado, el valor verdadero no va a saltar dentro o fuera.

0 votos

+1, también estoy tratando de entender la diferencia entre el intervalo de confianza y el intervalo creíble, y he encontrado su ejemplo de dibujo de la bola más legible que otros ejemplos en otros posts relacionados. Sólo una pregunta rápida, repito el experimento m veces, recogí m muestras diferentes, así que ahora he calculado m intervalos de confianza diferentes (cada uno con un nivel de confianza del 95%), ahora ¿qué es el intervalo de confianza? ¿Significa que el 95% de m CIs debe cubrir el valor verdadero?

0 votos

@loganecolss, Si repites el proceso suficientes veces, entonces sí, alrededor del 95% de los intervalos deberían contener el valor verdadero (no está garantizado que sea el 95%, porque sigue siendo un proceso aleatorio). Hay muchas simulaciones (y no es difícil hacerlo uno mismo) que generarán muchas muestras y te mostrarán sus intervalos de confianza junto con el valor "verdadero" para que puedas ver que aproximadamente el 95% cubren el valor verdadero.

0 votos

Si sólo tengo un par de muestras, ¿qué sentido tiene calcular los IC? Quiero decir que no podría repetir el proceso más que un par de veces.

3voto

Akira Puntos 1061

Nunca entendí los intervalos de confianza hasta que leí, en el artículo de la wikipedia, que los límites de los intervalos de confianza frecuentistas son variables aleatorias . Sí, se realizan algunos cálculos sobre los datos observados para construir intervalos de confianza, pero como los datos son (supuestamente) variables aleatorias, los intervalos de confianza también son variables aleatorias.

Así que para $l, u$ para ser un intervalo de confianza simétrico del 95 % sobre el parámetro de la población, $\theta$ Por ejemplo, debería darse el caso de que $l$ es una variable aleatoria mayor que $\theta$ con una probabilidad del 2,5 %, y de forma similar $u$ es una variable aleatoria menor que $\theta$ con una probabilidad del 2,5%. Por la razón que sea, esta formulación me resulta más fácil de entender: hay algún parámetro poblacional desconocido; extraigo una muestra de la población; como parte de mi extracción, se gastan 2 "grados de libertad" en lanzar monedas sesgadas para saber si el $l$ y $u$ delimitará realmente el parámetro desconocido; calculo $l$ y $u$ de mi muestra.

0 votos

Asimismo, el estadístico t (a partir del cual se construye el IC) es una variable aleatoria.

0voto

mj2008 Puntos 4815

Fruequista:

Al construir un intervalo de confianza de 1 alfa, los intervalos de confianza de 1 alfa generados de esta manera incluirán el parámetro poblacional "verdadero". Aquí el parámetro poblacional es fijo y los límites del intervalo de confianza son aleatorios.

Sin embargo, esto no dice nada sobre la probabilidad de que un determinado intervalo de confianza incluya el parámetro poblacional a posteriori. Después del hecho, el intervalo de confianza incluye el parámetro poblacional o no lo incluye. Ya no hay nada probabilístico. Por tanto, no se puede decir que el parámetro verdadero se encuentra dentro del intervalo de confianza {-0,34, 0,2} con una probabilidad del 95%, sino que el 95% de los intervalos de confianza generados por el mismo procedimiento (muestreo aleatorio, etc.) incluirán el parámetro poblacional fijo.

Se puede encontrar una buena animación que ilustra los intervalos de confianza en el sitio web de Yihui Xie, que es autor del paquete de animación en R:

Animación de los intervalos de confianza: http://animation.yihui.name/mathstat:confidence_interval

Paquete de animación en CRAN: http://cran.r-project.org/web/packages/animation/index.html

Bayesiano

Por otro lado, los bayesianos incorporan la incertidumbre/información sobre el parámetro de la población en sus estadísticas (esto es lo que se llama "a priori"). Así que un intervalo creíble podría considerarse mejor como una región de máxima creencia subjetiva. "Basándome en la información previa y en los datos, creo en un 1 % alfa que el intervalo {-0,34, 0,2} incluye el parámetro". La mayoría de las veces esta creencia subjetiva se basa en otros datos.

Uso práctico

Ambos intervalos dicen algo sobre la precisión de nuestra estimación. Si quiere dejar que los datos hablen por sí mismos, podría utilizar intervalos de confianza o intervalos creíbles bayesianos con una prioridad uniforme. Sin embargo, si tienes información a priori fuerte que quieres incluir no sólo en tu sección de discusión sino también en tus estadísticas, yo usaría intervalos creíbles. Así que para mí el problema es más de lo que quieres y menos de la interpretación.

0 votos

La idea de que los IC son una indicación de la precisión es una falacia. Como usted indica, la teoría de los IC sólo se ocupa del procedimiento, no dice nada sobre el resultado. El propio Neyman ya dijo que no se puede derivar cualquier creer sobre el parámetro de un CI resultante.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X