11 votos

Hay una base matemática para la idea de que esta interpretación de los intervalos de confianza es incorrecta, o es sólo frecuentista de la filosofía?

Supongamos que la media de tiempo que le toma a todos los trabajadores en una ciudad en particular para llegar a su trabajo se calcula como:$21$. Un $95\%$ intervalo de confianza se calcula en $(18.3, 23.7).$

De acuerdo a este sitio web, la siguiente declaración es incorrecta:

Hay un $95\%$ de probabilidad de que la media de tiempo que le toma a todos los trabajadores en esta ciudad para ir a trabajar entre el $18.3$ $23.7$ minutos.

De hecho, una gran cantidad de sitios web de eco de un sentimiento similar. Este, por ejemplo, dice:

No es muy correcto para preguntar acerca de la probabilidad de que el intervalo contiene la media de población. Tampoco hace o no.

El meta-concepto en el trabajo parece ser la idea de que los parámetros de la población no puede ser al azar, sólo los datos que obtenemos acerca de ellos puede ser al azar (relacionados). Este no se sienta bien conmigo, porque tiendo a pensar que la probabilidad como ser fundamentalmente acerca de nuestra certeza de que el mundo es de una manera determinada. También, si lo he entendido correctamente, no hay realmente ninguna base matemática de la noción de que las probabilidades sólo se aplican a los datos y no los parámetros; en particular, esto parece ser una manifestación de la frecuentista/bayesianism debate.

Pregunta. Si los comentarios anteriores son correctas, entonces parecería que el tipo de declaraciones hechas en las referidas páginas web no debe ser tomado demasiado en serio. Para reforzar su afirmación, yo estoy bajo la impresión de que si un examen de grado fueron a marcar un estudiante de la mencionada "incorrecta" la interpretación de los intervalos de confianza, mi impresión es que esto sería inapropiado (esto no me ha ocurrido; es un hipotético).

En cualquier caso, basado en la matemática subyacente, son estos comentarios estoy haciendo, o es que hay algo que me falta?

8voto

JiminyCricket Puntos 143

Debemos distinguir entre las dos afirmaciones aquí:

  1. Los parámetros de la población no puede ser al azar, sólo los datos que obtenemos acerca de ellos puede ser al azar.
  2. La interpretación de los intervalos de confianza como la que contiene un parámetro con una cierta probabilidad que está mal.

El primero es un barrido de la declaración de que usted describe correctamente como frecuentista de la filosofía (en algunos casos "dogma" parecería más apropiado) y que no es necesario suscribirse si usted encuentra una interpretación subjetivista de la probabilidad de ser interesante, útil o tal vez incluso la verdad. (Ciertamente, encontrar, al menos, interesantes y útiles.)

La segunda declaración, sin embargo, es cierto. Los intervalos de confianza son inherentemente frecuentista animales; están construidos con el objetivo de que no importa lo que el valor del parámetro desconocido es, para cualquier valor fijo que tienen el mismo prescribe la probabilidad de construir un intervalo de confianza que contiene el "verdadero" valor del parámetro. No se puede construir de acuerdo a este frecuentista de la prescripción y, a continuación, reinterpretarlos en un subjetivista; que conduce a una afirmación que es falsa, no porque no siga frecuentista de dogma, sino porque no se deriva de una probabilidad subjetiva. Un enfoque Bayesiano conduce a un intervalo diferente, que es justamente dado un nombre diferente, un intervalo creíble.

Un ejemplo muy instructivo es el otorgado por los intervalos de confianza para la incógnita de la tasa parámetro de un proceso de Poisson con el conocido ruido de fondo de la tasa. En este caso, no son los valores de los datos de los que es cierto que el intervalo de confianza hace que no contienen la "verdad" de los parámetros. Esto no es un error en la construcción de los intervalos; ellos tienen que ser construidos como que les permiten ser interpretados en un frecuentista manera. La interpretación de un intervalo de confianza en un subjetivista manera el resultado sería una tontería. Los intervalos de credibilidad Bayesianos, por otro lado, siempre tienen una cierta probabilidad de que contiene el "azar" de los parámetros.

He leído una buena exposición de este ejemplo hace poco, pero no puedo encontrar ahora mismo, voy a publicar si lo encuentro de nuevo, pero por ahora creo que este papel también es útil en la introducción. (Ejemplo $11$ en p. $20$ es particularmente divertido.)

5voto

Tom Puntos 23

Aquí es cómo aparece en Larry Wasserman Todo de Estadísticas

Advertencia ! Hay mucha confusión acerca de cómo interpretar un intervalo de confianza. Un intervalo de confianza no es una probabilidad de declaración sobre la $\theta$ (parámetro del problema), ya que $\theta$ es una cantidad fija, no una variable aleatoria. Algunos textos interpretar de la siguiente forma: Si me repito una y otra vez, el intervalo deberá contener el parámetro 95 por ciento del tiempo. Esto es correcto, pero inútil ya que raras veces el mismo experimento una y otra vez. Una mejor interpretación es esta: el día 1 De recopilar datos y la construcción de un 95% de intervalo de confianza para un parámetro de $\theta_1$. En el día 2, se recopilan nuevos datos y la construcción de un 95% de intervalo de confianza para una relación de parámetro $\theta_2$. [...] Continuar de esta manera la construcción de intervalos de confianza para una secuencia de la relación de los parámetros de $\theta_1, \theta_2, \dots$. A continuación, el 95 por ciento de su intervalos de captura el verdadero valor del parámetro. No hay necesidad de introducir la idea de repetir el mismo experimento una y otra vez.

3voto

Ben Puntos 236

Los intervalos de confianza dentro de la frecuentista paradigma: estás en lo correcto de que estas afirmaciones (advertencia en contra de la interpretación del intervalo de confianza como un intervalo de probabilidad del parámetro) provienen del hecho de que los intervalos de confianza surgir en la clásica, frecuentista método, y en ese contexto, el parámetro se considera fijo "desconocido constante", no una variable aleatoria. Hay una probabilidad declaración relativa al intervalo de confianza, la cual es:

$$\mathbb{P}(L(\mathbf{X}) \leqslant \mu \leqslant U(\mathbf{X}) \mid \mu) = 1-\alpha,$$

donde $L(\mathbf{X})$ $U(\mathbf{X})$ son límites formado como funciones de los datos de la muestra $\mathbf{X}$ (normalmente, a través de la utilización de reordenamiento de una probabilidad declaración sobre un pivote cantidad). Es importante destacar que, el vector de datos $\mathbf{X}$ es la variable aleatoria en esta probabilidad declaración, y el parámetro de $\mu$ es tratado como un "desconocido constante". (He indicado esta poniendo como un condicionamiento variable, pero dentro de la frecuentista paradigma de que no se especifique este; solo sería ser implícita.) El intervalo de confianza se deriva de esta probabilidad declaración por tomar la observada de la muestra de datos de $\mathbf{x}$ a ceder el intervalo fijo $\text{CI}(1-\alpha) = [ L(\mathbf{x}), U(\mathbf{x}) ]$.

La razón de las afirmaciones que usted está leyendo es que una vez que se reemplace la muestra aleatoria de datos $\mathbf{X}$ con la observada de la muestra de datos de $\mathbf{x}$, ya no podrá realizar la probabilidad de declaración análoga a la anterior. Puesto que los datos y los parámetros son dos constantes, ahora tiene la trivial declaración:

$$\mathbb{P}(L(\mathbf{x}) \leqslant \mu \leqslant U(\mathbf{x})) = \begin{cases} 0 & \text{if } \mu \notin \text{CI}(1-\alpha), \\[6pt] 1 & \text{if } \mu \in \text{CI}(1-\alpha). \end{cases}$$


Los intervalos de confianza dentro del paradigma Bayesiano: Si prefiere interpretar el parámetro desconocido $\mu$ como una variable aleatoria, se están realizando ahora un Bayesiano de tratamiento del problema. Aunque el intervalo de confianza es un procedimiento formulada dentro del paradigma clásico, es posible interpretarlo en el contexto del análisis Bayesiano.

Sin embargo, incluso dentro de un contexto Bayesiano, es que aún no es válido afirmar , a posteriori, que el CI contiene el verdadero parámetro con la probabilidad especificada. De hecho, esta probabilidad posterior depende de la distribución previa para el parámetro. Para ver esto, observamos que:

$$\mathbb{P}(L(\mathbf{x}) \leqslant \mu \leqslant U(\mathbf{x}) \mid \mathbf{x}) = \int \limits_{L(\mathbf{x})}^{U(\mathbf{x})} \pi(\mu | \mathbf{x}) d\mu = \frac{\int_{L(\mathbf{x})}^{U(\mathbf{x})} L_\mathbf{x}(\mu) \pi(\mu)d\mu}{\int L_\mathbf{x}(\mu) \pi(\mu) d\mu}.$$

Esta probabilidad posterior depende de la previa, y en general no es igual a $1-\alpha$ (aunque puede ser en algunos casos especiales). La inicial de la probabilidad de instrucción utilizado en el intervalo de confianza se impone una restricción sobre la distribución de muestreo, lo que restringe la probabilidad de la función, pero todavía nos permite libertad de elegir diferentes priores, produciendo diferentes probabilidades posteriores para la corrección del intervalo.

(Nota: es fácil mostrar que $\mathbb{P}(L(\mathbf{X}) \leqslant \mu \leqslant U(\mathbf{X})) = 1-\alpha$ el uso de la ley-de-total probabilidad, pero este es un previo de probabilidad, no una probabilidad posterior, ya que no en la condición de los datos. Así, dentro del paradigma Bayesiano, podemos decir a priori que el intervalo de confianza contendrá el parámetro con la probabilidad especificada, pero no podemos en general dicen que esta a posteriori.)

2voto

Hariharan Puntos 11

La muy técnica definición de un 95% intervalo de confianza implica que si tuviéramos que repetir el experimento 100 veces, 95 de los tiempos de nuestro intervalo de confianza tendría la verdadera media de población.

Así diciendo que un intervalo de confianza es la probabilidad de que la verdadera media de la población es radica en que no parece intuitivamente mal, pero técnicamente las probabilidades podrían funcionar de manera diferente dependiendo de cómo hemos estado.

La definición se basa en la verdadera media de la población es de ser una constante y nuestra intervalos de clase de adivinación, mientras que el de costumbre, técnicamente incorrecta, la respuesta intuitiva depende de nuestro intervalo de confianza de ser constante y de nuestra verdadera significa cambiar de posición al azar.

Espero que esto arroja un poco de luz sobre este tema.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X