50 votos

¿Aclaración sobre la interpretación de los intervalos de confianza?

Mi comprensión actual de la noción de "intervalo de confianza con nivel de confianza $1 - \alpha$ "es que si intentamos calcular el intervalo de confianza muchas veces (cada vez con una muestra nueva), contendría el parámetro $1 - \alpha$ del tiempo.

Aunque me doy cuenta de que esto no es lo mismo que "la probabilidad de que el parámetro verdadero se encuentre en este intervalo", hay algo que quiero aclarar.

[Actualización importante]

Antes de calcular un intervalo de confianza del 95%, existe una probabilidad del 95% de que el intervalo que calculamos cubra el parámetro verdadero. Después de que hayamos calculado el intervalo de confianza y hayamos obtenido un intervalo determinado $[a,b]$ Ya no podemos decir esto. Ni siquiera podemos hacer una especie de argumento no frecuentista de que estamos 95% seguros de que el verdadero parámetro estará en $[a,b]$ ya que si pudiéramos, se contradeciría con contraejemplos como éste: ¿Qué es exactamente un intervalo de confianza?

No quiero hacer de esto un debate sobre la filosofía de la probabilidad, sino que busco una explicación precisa y matemática del cómo y el porqué de ver el intervalo concreto $[a,b]$ cambia (o no cambia) la probabilidad del 95% que teníamos antes de ver ese intervalo. Si argumentas que "después de ver el intervalo, la noción de probabilidad deja de tener sentido", entonces bien, trabajemos en una interpretación de la probabilidad en la que hace tiene sentido.

Más concretamente:

Supongamos que programamos un ordenador para calcular un intervalo de confianza del 95%. El ordenador hace algunos cálculos, calcula un intervalo y se niega a mostrarme el intervalo hasta que introduzca una contraseña. Antes de introducir la contraseña y ver el intervalo (pero después de que el ordenador lo haya calculado), ¿cuál es la probabilidad de que el intervalo contenga el parámetro verdadero? Es del 95%, y esta parte no se puede debatir : esta es la interpretación de la probabilidad que me interesa para esta pregunta en particular (me doy cuenta de que hay cuestiones filosóficas importantes que estoy suprimiendo, y esto es intencional).

Pero en cuanto introduzco la contraseña y hago que el ordenador me muestre el intervalo que ha calculado, la probabilidad (de que el intervalo contenga el parámetro verdadero) podría cambiar. Cualquier afirmación de que esta probabilidad nunca cambia contradiría el contraejemplo anterior. En este contraejemplo, la probabilidad podría cambiar del 50% al 100%, pero...

  • ¿Hay algún ejemplo en el que la probabilidad cambie a algo distinto del 100% o del 0% (EDIT: y si es así, cuáles son)?

  • ¿Hay algún ejemplo en el que la probabilidad no cambie después de ver el intervalo particular $[a,b]$ (es decir, la probabilidad de que el parámetro verdadero se encuentre en $[a,b]$ sigue siendo del 95%)?

  • ¿Cómo (y por qué) cambia la probabilidad en general después de ver que el ordenador escupe $[a,b]$ ?

[Editar]

Gracias por todas las buenas respuestas y los útiles debates.

32voto

John Richardson Puntos 1197

Creo que el problema fundamental es que la estadística frecuentista sólo puede asignar una probabilidad a algo que puede tener una frecuencia a largo plazo. El hecho de que el valor real de un parámetro se encuentre o no en un intervalo concreto no tiene una frecuencia a largo plazo, porque sólo podemos realizar el experimento una vez, por lo que no se puede asignar una probabilidad frecuentista. El problema surge de la definición de probabilidad. Si se cambia la definición de probabilidad por una bayesiana, el problema desaparece instantáneamente, pues ya no se está atado a la discusión de las frecuencias de largo plazo.

Véase mi respuesta (más bien burlona) a una pregunta relacionada aquí :

" Un frecuentista es alguien que cree que las probabilidades representan frecuencias a largo plazo con las que ocurren los acontecimientos; si es necesario, se inventará una población ficticia de la que su situación particular podría considerarse una muestra aleatoria para poder hablar con sentido de las frecuencias a largo plazo. Si le haces una pregunta sobre una situación concreta, no te dará una respuesta directa, sino que hará una afirmación sobre esta población (posiblemente imaginaria). "

En el caso de un intervalo de confianza, la pregunta que normalmente nos gustaría hacer (a menos que tengamos un problema de control de calidad, por ejemplo) es "dada esta muestra de datos, devuélvase el intervalo más pequeño que contenga el valor verdadero del parámetro con probabilidad X". Sin embargo, un frecuentista no puede hacer esto, ya que el experimento sólo se realiza una vez y, por tanto, no hay frecuencias a largo plazo que puedan utilizarse para asignar una probabilidad. Por tanto, el frecuentista tiene que inventar una población de experimentos (que no has realizado) de la que el experimento que has realizado puede considerarse una muestra aleatoria. El frecuencialista te da entonces una respuesta indirecta sobre esa población ficticia de experimentos, en lugar de una respuesta directa a la pregunta que realmente querías hacer sobre un experimento concreto.

Esencialmente es un problema de lenguaje, la definición frecuentista de una población simplemente no permite discutir la probabilidad de que el valor verdadero de un parámetro se encuentre en un intervalo particular. Esto no significa que la estadística frecuentista sea mala o que no sea útil, pero es importante conocer sus limitaciones.

En cuanto a la gran actualización

No estoy seguro de que podamos decir que "antes de calcular un intervalo de confianza del 95%, existe una probabilidad del 95% de que el intervalo que calculamos cubra el parámetro verdadero" dentro de un marco frecuentista. Aquí hay una inferencia implícita de que la frecuencia a largo plazo con la que el valor verdadero del parámetro se encuentra en los intervalos de confianza construidos por algún método particular es también la probabilidad de que el valor verdadero del parámetro se encuentre en el intervalo de confianza para la muestra particular de datos que vamos a utilizar. Se trata de una inferencia perfectamente razonable, pero es una inferencia bayesiana, no frecuentista, ya que la probabilidad de que el valor verdadero del parámetro se encuentre en el intervalo de confianza que construimos para una muestra concreta de datos no tiene frecuencia a largo plazo, ya que sólo tenemos una muestra de datos. Este es exactamente el peligro de la estadística frecuentista, el razonamiento de sentido común sobre la probabilidad es generalmente bayesiano, en el sentido de que se trata del grado de plausibilidad de una proposición.

Sin embargo, podemos "hacer algún tipo de argumento no frecuentista de que estamos seguros en un 95% de que el parámetro verdadero estará en [a,b]", eso es exactamente lo que es un intervalo creíble bayesiano, y para muchos problemas el intervalo creíble bayesiano coincide exactamente con el intervalo de confianza frecuentista.

"No quiero convertir esto en un debate sobre la filosofía de la probabilidad", lamentablemente esto es inevitable, la razón por la que no se puede asignar una probabilidad frecuentista a si el verdadero valor de la estadística se encuentra en el intervalo de confianza es una consecuencia directa de la filosofía frecuentista de la probabilidad. Los frecuentistas sólo pueden asignar probabilidades a cosas que pueden tener frecuencias a largo plazo, ya que así es como los frecuentistas definen la probabilidad en su filosofía. Eso no hace que la filosofía frecuentista sea errónea, pero es importante entender los límites impuestos por la definición de una probabilidad.

"Antes de introducir la contraseña y ver el intervalo (pero después de que el ordenador lo haya calculado), ¿cuál es la probabilidad de que el intervalo contenga el parámetro verdadero? Es del 95%, y esta parte no es discutible:" Esto es incorrecto, o al menos al hacer tal afirmación, te has apartado del marco de la estadística frecuentista y has hecho una inferencia bayesiana que implica un grado de verosimilitud en la verdad de una afirmación, en lugar de una frecuencia a largo plazo. Sin embargo, como he dicho antes, es una inferencia perfectamente razonable y natural.

Nada ha cambiado antes o después de introducir la contraseña, porque a ninguno de los dos eventos se le puede asignar una probabilidad frecuentista. La estadística frecuencial puede ser bastante contraintuitiva, ya que a menudo queremos plantear preguntas sobre los grados de verosimilitud de las afirmaciones relativas a determinados acontecimientos, pero esto queda fuera del ámbito de la estadística frecuencial, y éste es el origen de la mayoría de las interpretaciones erróneas de los procedimientos frecuenciales.

16voto

Shawn Puntos 8120

Actualización importante, respuesta nueva importante. Permítanme tratar de abordar claramente este punto, porque es donde radica el problema:

"Si argumentas que "después de ver el intervalo, la noción de probabilidad ya no tiene sentido", entonces bien, trabajemos en una interpretación de la probabilidad en la que sí tenga sentido."

Las reglas de la probabilidad no cambian, pero su modelo de universo sí. ¿Estás dispuesto a cuantificar tus creencias previas sobre un parámetro utilizando una distribución de probabilidad? ¿Es razonable actualizar esa distribución de probabilidad después de ver los datos? Si crees que sí, entonces puedes hacer afirmaciones como $P(\theta\in [L(X), U(X)]| X=x)$ . Mi distribución a priori puede representar mi incertidumbre sobre el verdadero estado de la naturaleza , no sólo aleatoriedad como se entiende comúnmente - es decir, si asigno una distribución a priori al número de bolas rojas en una urna eso no significa que piense que el número de bolas rojas es aleatorio. Es fijo, pero no estoy seguro de ello.

Varias personas, incluido yo, han dicho esto, pero si no estás dispuesto a llamar $\theta$ una variable aleatoria, entonces la afirmación $P(\theta\in [L(X), U(X)]| X=x)$ no tiene sentido. Si soy un frecuentista, estoy tratando $\theta$ como una cantidad fija Y no puedo atribuirle una distribución de probabilidad. ¿Por qué? Porque es fija, y mi interpretación de la probabilidad es en términos de frecuencias a largo plazo. El número de bolas rojas en la urna no cambia nunca. $\theta$ es lo que $\theta$ es. Si saco unas cuantas bolas entonces tengo una muestra aleatoria. Puedo preguntar qué pasaría si sacara un montón de muestras aleatorias, es decir, puedo hablar de $P(\theta\in [L(X), U(X)])$ porque el intervalo depende de la muestra, que es (¡espera!) aleatoria.

Pero tú no quieres eso. Lo que quieres es $P(\theta\in [L(X), U(X)]| X=x)$ - cuál es la probabilidad de que este intervalo que he construido con mi muestra observada (y ahora fijada) contenga el parámetro. Sin embargo, una vez que haya condicionado en $X=x$ entonces para mí, un frecuentista, no queda nada al azar y la afirmación $P(\theta\in [L(X), U(X)]| X=x)$ no tiene sentido de ninguna manera significativa.

La única forma de principio (OMI) para hacer una declaración sobre $P(\theta\in [L(X), U(X)]| X=x)$ es cuantificar nuestra incertidumbre sobre un parámetro con una distribución de probabilidad (a priori) y actualizar esa distribución con nueva información mediante el Teorema de Bayes. Todos los demás enfoques que he visto son una aproximación mediocre a Bayes. Desde luego, no se puede hacer desde una perspectiva frecuentista.

Esto no quiere decir que no se puedan evaluar los procedimientos frecuentistas tradicionales desde una perspectiva bayesiana (a menudo los intervalos de confianza son sólo intervalos creíbles bajo priores uniformes, por ejemplo) o que la evaluación de los estimadores bayesianos/intervalos creíbles desde una perspectiva frecuentista no sea valiosa (creo que puede serlo). Esto no quiere decir que la estadística clásica/frecuentista sea inútil, porque no lo es. Es lo que es, y no deberíamos intentar hacerla más.

¿Crees que es razonable dar a un parámetro una distribución a priori para representar tus creencias sobre el universo? Por tus comentarios parece que sí; según mi experiencia, la mayoría de la gente estaría de acuerdo (ésa es la pequeña media broma que hice en mi comentario a la respuesta de @G. Jay Kerns). Si es así, el paradigma bayesiano proporciona una forma lógica y coherente de hacer afirmaciones sobre $P(\theta\in [L(X), U(X)]| X=x)$ . El enfoque frecuentista simplemente no lo hace.

11voto

Bien, ¡ahora sí! He votado por borrar mi respuesta anterior porque no tiene sentido con esta pregunta tan actualizada.

En esta nueva pregunta actualizada, con un ordenador que calcula intervalos de confianza del 95%, bajo la interpretación frecuentista ortodoxa, aquí están las respuestas a sus preguntas:

  1. No.
  2. No.
  3. Una vez que se observa el intervalo, ya no es aleatorio y no cambia. (Tal vez el intervalo era $[1,3]$ .) Pero $\theta$ tampoco cambia, y nunca ha cambiado. (Tal vez sea $\theta = 7$ .) La probabilidad cambia del 95% al 0% porque el 95% de los intervalos que calcula el ordenador cubren 7, pero el 100% de los intervalos $[1,3]$ NO cubra el 7.

(Por cierto, en el mundo real, el experimentador nunca sabe que $\theta = 7$ lo que significa que el experimentador nunca puede saber si la verdadera probabilidad $[1,3]$ cubre $\theta$ es cero o uno. (Sólo puede decir que debe ser uno o el otro). Eso, además de que el experimentador puede decir que el 95% de los intervalos del ordenador cubren $\theta$ pero eso ya lo sabíamos.

El espíritu de su pregunta no deja de insinuar que el observador conocimiento y cómo se relaciona con el lugar donde $\theta$ mentiras. Por eso (presumiblemente) hablabas de la contraseña, de que el ordenador calculaba el intervalo sin que tú lo vieras todavía, etc. . He visto en sus comentarios a las respuestas que parece insatisfactorio/imposible estar obligado a comprometerse con el 0 o el 1, después de todo, ¿por qué no podríamos creer que es el 87%, o $15/16$ o incluso el 99% Pero ése es exactamente el poder -y simultáneamente el talón de Aquiles- del marco frecuentista: el conocimiento/creencia subjetiva del observador es irrelevante. Todo lo que importa es una frecuencia relativa a largo plazo. Nada más y nada menos.

Como BTW final: si cambias tu interpretación de la probabilidad (lo cual has elegido no hacer para esta pregunta), entonces las nuevas respuestas son:

  1. Sí.
  2. Sí.
  3. La probabilidad cambia porque probabilidad = conocimiento subjetivo, o grado de creencia, y el conocimiento del observador cambió. Representamos el conocimiento con distribuciones previas/posteriores, y a medida que se dispone de nueva información, las primeras se transforman en las segundas (mediante la regla de Bayes).

(Pero para que quede claro, la configuración que describes no se ajusta muy bien a la interpretación subjetiva. Por ejemplo, solemos tener un intervalo creíble previo del 95% incluso antes de encender el ordenador, luego lo encendemos y empleamos el ordenador para que nos dé un intervalo creíble posterior del 95% que suele ser considerablemente más delgado que el anterior).

6voto

pkaeding Puntos 12935

Aportaré mi granito de arena (tal vez redistribuyendo algunas de las respuestas anteriores). Para un frecuentista, el propio intervalo de confianza es en esencia una variable aleatoria bidimensional: si que se rehiciera el experimento un gazillón de veces, el intervalo de confianza que se estimación (es decir, calcular a partir de los datos recién encontrados cada vez) sería diferente cada vez. Como tal, los dos límites del intervalo son variables aleatorias.

Por lo tanto, un IC del 95% no significa más que la garantía (dado que todos los supuestos que conducen a este IC son correctos) de que este conjunto de variables aleatorias contendrá el valor verdadero (una expresión muy frecuentista) en el 95% de los casos.

Puedes calcular fácilmente el intervalo de confianza para la media de 100 extracciones de una distribución normal estándar. Entonces, si sacas 10000 veces 100 valores de esa distribución normal estándar, y cada vez calculas el intervalo de confianza para la media, verás efectivamente que el 0 está ahí unas 9500 veces.

El hecho de que tienen crear un intervalo de confianza sólo una vez (a partir de sus datos reales) reduce efectivamente la probabilidad de que el valor verdadero esté en que a 0 o 1, pero no cambia la probabilidad de que el intervalo de confianza como variable aleatoria contenga el valor verdadero.

Así que, en resumen: la probabilidad de cualquier (es decir, en promedio) el intervalo de confianza del 95% que contiene el valor verdadero (95%) no cambia, ni tampoco la probabilidad de un intervalo concreto (CI o lo que sea) de contener el valor verdadero (0 o 1). La probabilidad del intervalo que el ordenador conoce, pero que usted no conoce, es en realidad 0 o 1 (porque es un intervalo particular), pero como usted no lo conoce (y, de forma frecuentista, no puede volver a calcular este mismo intervalo infinitas veces a partir de los mismos datos), lo único a lo que puede recurrir es a la probabilidad de cualquier intervalo.

5voto

John Richardson Puntos 1197

No creo que un frecuentista pueda decir que hay alguna probabilidad de que el valor verdadero (poblacional) de una estadística se encuentre en el intervalo de confianza para una muestra concreta. O lo está o no lo está, pero no existe una frecuencia a largo plazo para un evento concreto, sino la población de eventos que se obtendría mediante la realización repetida de un procedimiento estadístico. Por eso tenemos que ceñirnos a afirmaciones como "el 95% de los intervalos de confianza así construidos contendrán el verdadero valor de la estadística", pero no "existe una probabilidad p% de que el verdadero valor se encuentre en el intervalo de confianza calculado para esta muestra concreta". Esto es cierto para cualquier valor de p, simplemente no es posible con la definición frecuentista de lo que es una probabilidad. Sin embargo, un bayesiano puede hacer esa afirmación utilizando un intervalo de confianza.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X