110 votos

¿Lo que, precisamente, es un intervalo de confianza?

Sé que a groso modo y de manera informal lo que un intervalo de confianza. Sin embargo, me parece que no puede envolver mi cabeza alrededor de uno de los más detalle importante: Según Wikipedia:

Un intervalo de confianza no predice que el verdadero valor del parámetro tiene una probabilidad de estar en el intervalo de confianza de la vista de los datos obtenidos.

También he visto puntos similares realizados en varios lugares en este sitio. Una definición más correcta, también de la Wikipedia, es:

si los intervalos de confianza se construyen a través de muchos separado análisis de datos de las repetidas (y posiblemente diferentes), los experimentos, la proporción de los intervalos que contienen el verdadero valor del parámetro será de aproximadamente coincide con el nivel de confianza

De nuevo, he visto puntos similares realizados en varios lugares en este sitio. No lo entiendo. Si, en virtud de la repetición de experimentos, la fracción de la confianza de los intervalos que contienen el verdadero parámetro de $\theta$$(1 - \alpha)$, entonces ¿cómo puede la probabilidad de que $\theta$ está en el intervalo de confianza calculado para la experimentación real, ser otra cosa que $(1 - \alpha)$? Yo estoy buscando lo siguiente en una respuesta:

  1. Aclaración de la distinción entre lo correcto e incorrecto de las definiciones anteriores.

  2. Formal, la definición precisa de un intervalo de confianza que muestra claramente por qué la primera definición es incorrecta.

  3. Un ejemplo concreto de un caso en el que la primera definición es muy equivocados, incluso si el modelo subyacente es correcta.

49voto

jldugger Puntos 7490

Hay muchas cuestiones relativas a los intervalos de confianza, pero vamos a centrarnos en las citas. El problema radica en las posibles malas interpretaciones, en lugar de ser una cuestión de corrección. Cuando la gente dice "parámetro tiene una determinada probabilidad de" algo, están pensando en el parámetro como una variable aleatoria. Este no es el punto de vista de un (clásica) intervalo de confianza del procedimiento, para que la variable aleatoria es el intervalo de tiempo propio y el parámetro es determinado, no al azar, aún desconocidos. Esta es la razón por la que tales declaraciones son atacados con frecuencia.

Matemáticamente, si dejamos $t$ ser cualquier procedimiento que asigna los datos de $\mathbf{x} = (x_i)$ a los subconjuntos del espacio de parámetros y si (no importa el valor del parámetro $\theta$) la afirmación de $\theta \in t(\mathbf{x})$ define un evento $A(\mathbf{x})$, entonces-por definición-que tiene una probabilidad de $\Pr_{\theta}\left( A(\mathbf{x}) \right)$ para cualquier valor posible de $\theta$. Al $t$ es un intervalo de confianza del procedimiento con la confianza de $1-\alpha$, a continuación, esta probabilidad se supone que tiene un infimum (sobre todos los valores de parámetro) de $1-\alpha$. (Sujeto a este criterio, se suelen seleccionar los procedimientos que optimizan algunas propiedades adicionales, tales como la producción de cortos intervalos de confianza o simétricos, pero eso es un asunto separado.) La Débil Ley de los Grandes Números, a continuación, justifica la segunda cita. Que, sin embargo, no es una definición de intervalos de confianza: es simplemente una propiedad que tienen.

Creo que este análisis ha respondido a la pregunta 1, se muestra que la premisa de la pregunta 2 es incorrecta, y hace la pregunta 3 discutible.

32voto

Adrian Puntos 440

He encontrado este experimento útil cuando se piensa acerca de los intervalos de confianza. También responde a su pregunta 3.

Deje $X\sim U(0,1)$$Y=X+a-\frac{1}{2}$. Considere dos observaciones de $Y$ tomando los valores de $y_1$ $y_2$ correspondiente a las observaciones $x_1$$x_2$$X$, y deje $y_l=\min(y_1,y_2)$$y_u=\max(y_1,y_2)$. A continuación, $[y_l,y_u]$ es de un 50% intervalo de confianza para $a$ (ya que el intervalo incluye el $a$ si $x_1<\frac12<x_2$ o $x_1>\frac12>x_2$, cada uno de los cuales tiene probabilidad de $\frac14$).

Sin embargo, si $y_u-y_l>\frac12$ a continuación, se sabe que la probabilidad de que el intervalo contenga $a$$1$, no $\frac12$. La sutileza es que un $z\%$ intervalo de confianza para un parámetro significa que los extremos del intervalo (que son variables aleatorias) se encuentran ambos lados del parámetro, con una probabilidad de $z\%$ antes de calcular el intervalo, no es que la probabilidad de que el parámetro se encuentren dentro de un intervalo de $z\%$ después de haber calculado el intervalo.

21voto

patfla Puntos 1

Yo no llamaría a la definición de la Cei mal, pero son fáciles de mal interpretar, debido a que habrá más de una definición de la probabilidad. Los ci se basa en la siguiente definición de Probabilidad (Frecuentista o ontológica)

(1)la probabilidad de una proposición a=a largo plazo de la proporción de veces que la proposición se observa para ser verdad, condicional en el proceso de generación de datos

Por lo tanto, con el fin de ser conceptualmente válido en el uso de un CI, usted debe aceptar esta definición de probabilidad. Si no, entonces su intervalo no es un CI, desde un punto de vista teórico.

Esta es la razón por la definición que se utiliza la palabra proporción y NO la palabra de probabilidad, para dejar claro que el "largo plazo de la frecuencia" de la definición de probabilidad se utiliza.

La principal variante de la definición de Probabilidad (Epistemológico o de la probabilidad como una extensión de deductivo de la Lógica o Bayesiano) es

(2)la probabilidad de una proposición = racionales de grado de creencia de que la proposición es verdadera, condicional en un estado de conocimiento

La gente a menudo de forma intuitiva obtener tanto de estas definiciones se mezclan, y el uso de lo que la interpretación pasa a apelar a su intuición. Esto puede conseguir que en todo tipo de situaciones confusas (especialmente cuando se mueve de un paradigma a otro).

Que los dos enfoques a menudo conducen al mismo resultado, significa que en algunos casos tenemos:

racionales de grado de creencia de que la proposición es verdadera, condicional en un estado de conocimiento = largo plazo de la proporción de veces que la proposición se observa para ser verdad, condicional en el proceso de generación de datos

El punto es que no se sostiene universalmente, por lo que no podemos esperar que los dos definiciones distintas para siempre conducen a los mismos resultados. Así que, a menos que en realidad trabajan fuera la solución Bayesiana, y luego encontrar a ser el mismo intervalo de tiempo, no se puede dar el intervalo dado por el CI a la interpretación como una probabilidad de contener el verdadero valor. Y si lo hace, entonces el intervalo no es un Intervalo de Confianza, pero un Intervalo Creíble.

5voto

patfla Puntos 1

Desde una perspectiva teórica las Preguntas 2 y 3 se basan en la suposición incorrecta de que las definiciones son incorrectas. Así que estoy de acuerdo con @whuber la respuesta a ese respecto, y @whuber la respuesta a la pregunta 1 no requiere ninguna entrada adicional de mí.

Sin embargo, desde un punto de vista práctico, un intervalo de confianza puede ser dada su definición intuitiva (Probabilidad de que contenga el verdadero valor) cuando es numéricamente idéntico con un Bayesiano creíble intervalo basado en la misma información (es decir, un no-informativo antes).

Pero esto es algo desalentador para los die hard anti-bayesiano, porque en el fin de verificar las condiciones para dar su CI la interpretación que él/ella quiere dar, se debe trabajar la solución Bayesiana, para que la interpretación intuitiva mantiene automáticamente!

El ejemplo lo más fácil es $1-\alpha$ intervalo de confianza para la media normal con una varianza $\overline{x}\pm \sigma Z_{\alpha/2} $ $1-\alpha$ posterior creíble intervalo de $\overline{x}\pm \sigma Z_{\alpha/2} $.

No estoy exactamente seguro de las condiciones, pero sé que las siguientes son importantes para la interpretación intuitiva de la Cei tener:

1) un Pivote de estadística existe, cuya distribución es independiente de los parámetros (no exacta pivotes existen fuera de lo normal y de chi-cuadrado de las distribuciones?)

2) no hay molestia de los parámetros (excepto en el caso de una Fundamental de la estadística, que es uno de los pocos exacta maneras en que uno tiene que manejar una molestia parámetros al hacer CIs)

3) una suficiente estadística existe para el parámetro de interés, y el intervalo de confianza se utiliza la estadística suficiente

4) la distribución de muestreo de la estadística suficiente y la posterior distribución de tener algún tipo de simetría entre la suficiente estadístico y el parámetro. En el caso normal de la distribución de muestreo de la simetría está en $(\overline{x}|\mu,\sigma)\sim N(\mu,\frac{\sigma}{\sqrt{n}})$ mientras $(\mu|\overline{x},\sigma)\sim N(\overline{x},\frac{\sigma}{\sqrt{n}})$.

Estas condiciones son difíciles de encontrar, y por lo general es más rápido para trabajar la Bayesiano intervalo, y comparar. Un ejercicio interesante puede ser también para intentar responder a la pregunta "por qué antes es mi CI también un Intervalo Creíble?" Usted puede descubrir algunos de los secretos supuestos acerca de su CI procedimiento por mirar esto antes.

2voto

Abhinav Puntos 1161

Bien, me doy cuenta que al calcular un 95% intervalo de confianza para un parámetro mediante clásica, frecuentista métodos, no significa que hay un 95% de probabilidad de que el parámetro se encuentra dentro de ese intervalo. Y sin embargo ... cuando se aborda el problema desde una perspectiva Bayesiana, y calcular un 95% intervalo creíble para el parámetro, se obtiene (suponiendo que no informativo antes) exactamente el mismo intervalo de tiempo que usted consigue utilizando el enfoque clásico. Por lo tanto, si yo uso la estadística clásica para calcular el intervalo de confianza 95% para (decir) la media de un conjunto de datos, entonces es cierto que hay un 95% de probabilidad de que el parámetro se encuentra en ese intervalo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X