15 votos

Predicción y los Intervalos de Tolerancia

Tengo un par de preguntas para la predicción y los intervalos de tolerancia.

Vamos a estar de acuerdo en la definición de los intervalos de tolerancia primero: se Nos da un nivel de confianza del 90%, el porcentaje de la población a la captura, decir el 99%, y un tamaño de la muestra, por ejemplo, 20. La distribución de probabilidad se sabe, dicen que lo normal para su comodidad. Ahora, teniendo en cuenta las tres números (90%, 99% y 20) y el hecho de que la distribución subyacente es normal, se puede calcular la tolerancia de número de $k$. Dada una muestra $(x_1,x_2,\ldots,x_{20})$, con una media de $\bar{x}$ y la desviación estándar $s$, el intervalo de tolerancia es $\bar{x}\pm ks$. Si este intervalo de tolerancia captura 99% de la población, la muestra $(x_1,x_2,\ldots,x_{20})$ es llamado un éxito y el requisito es que el 90% de las muestras son éxitos.

Comentario: el 90% es el a priori de la probabilidad de que una muestra sea un éxito. El 99% es la probabilidad condicional de que un futuro de observación estará en el intervalo de tolerancia, dado que la muestra es un éxito.

Mis preguntas: Podemos ver la predicción intervalos de intervalos de tolerancia? Buscando en la web me dieron respuestas contradictorias en esto, por no hablar de que nadie realmente define los intervalos de predicción cuidadosamente. Por lo tanto, si usted tiene una definición precisa del intervalo de predicción (o de referencia), te lo agradecería.

Lo que he entendido es que un 99% de intervalo de predicción, por ejemplo, no captura el 99% de todos los valores futuros para todas las muestras. Este sería el mismo que el de un intervalo de tolerancia que captura el 99% de la población con 100% de probabilidad.

En las definiciones que he encontrado por un 90% de intervalo de predicción, el 90% es el a priori de la probabilidad dado un ejemplo, decir $(x_1,x_2,\ldots,x_{20})$ (tamaño fijo) y un único futuro de observación de la $y$, $y$ estará en el intervalo de predicción. Por lo tanto, parece que tanto la muestra y el valor futuro son dados al mismo tiempo, en contraste con el intervalo de tolerancia, donde la muestra es determinado y con una cierta probabilidad es un éxito, y bajo la condición de que la muestra es un éxito, un valor futuro es dada y con una cierta probabilidad cae en el intervalo de tolerancia. No estoy seguro de si la definición del intervalo de predicción es correcta o no, pero parece contrario a la intuición (al menos).

Alguna ayuda?

18voto

jldugger Puntos 7490

Sus definiciones parecen ser correctas.

El libro para consultar sobre estos temas de Estadística de Intervalos (Gerald Hahn & William Meeker), 1991. Cito:

Un intervalo de predicción para un único futuro de observación es un intervalo que, con un determinado grado de confianza, contienen la siguiente (o algún otro preespecificado, seleccionados al azar, de la observación de una población.

[A] intervalo de tolerancia es un intervalo que se puede pretender contener, al menos, una determinada proporción, p, de la población con un determinado grado de confianza, $100(1-\alpha)\%$.

Aquí están los restatements en matemáticas estándar de terminología. Deje que los datos $\mathbf{x}=(x_1,\ldots,x_n)$ ser considerada como una realización independiente de variables aleatorias $\mathbf{X}=(X_1,\ldots,X_n)$ comunes de la función de distribución acumulativa $F_\theta$. ($\theta$ aparece como un recordatorio de que $F$ puede ser desconocida, pero se supone que se encuentran en un determinado conjunto de distribuciones ${F_\theta \vert \theta \in \Theta}$). Deje $X_0$ ser otra variable aleatoria con la misma distribución $F_\theta$ e independiente de la primera $n$ variables.

  1. Un intervalo de predicción (por una sola futuro de observación), dado por los extremos de $[l(\mathbf{x}), u(\mathbf{x})]$, tiene la propiedad que define que

    $$ \inf_\theta\{{\Pr}_\theta(X_0 \in [l(\mathbf{X}), u(\mathbf{X})])\}= 100(1-\alpha)\%.$$

    Específicamente, ${\Pr}_\theta$ se refiere a la $n+1$ de la variable aleatoria de distribución de $(X_0, X_1, \ldots, X_n)$ determinado por la ley $F_\theta$. Nota la ausencia de probabilidades condicionales: este es un lleno de probabilidad conjunta. Nota, también, la ausencia de cualquier referencia a una secuencia temporal: $X_0$ muy bien puede ser observada en el tiempo antes de que el resto de los valores. No importa.

    No estoy seguro de qué aspecto(s) de esto puede ser "contrario a la intuición." Si concebimos la selección de un procedimiento estadístico, como una actividad a ser perseguido antes de la recolección de datos, esta es una forma natural y razonable de la formulación de un plan de proceso de dos pasos, ya que tanto los datos de ($X_i, i=1,\ldots,n$) y el "valor futuro" $X_0$ necesitan ser modelados como al azar.

  2. Un intervalo de tolerancia, dado los extremos $(L(\mathbf{x}), U(\mathbf{x})]$, tiene la propiedad que define que

    $$ \inf_\theta\{{\Pr}_\theta\left(F_\theta(U(\mathbf{X})) - F_\theta(L(\mathbf{X})\right) \ge p)\} = 100(1-\alpha)\%.$$

    Nota la ausencia de cualquier referencia a la $X_0$: no juega ningún papel.

Al $\{F_\theta\}$ es el conjunto de distribuciones Normales, existen intervalos de predicción de la forma

$$l(\mathbf{x}) = \bar{x} - k(\alpha, n) s, \quad u(\mathbf{x}) = \bar{x} + k(\alpha, n) s$$

($\bar{x}$ es la media de la muestra y $s$ es la desviación estándar de la muestra). Los valores de la función $k$, que Hahn & Meeker tabular, no dependen de los datos de $\mathbf{x}$. Hay otros predicción intervalo de procedimientos, incluso en el caso Normal: estos no son los únicos.

Del mismo modo, existen intervalos de tolerancia de la forma

$$L(\mathbf{x}) = \bar{x} - K(\alpha, n, p) s, \quad U(\mathbf{x}) = \bar{x} + K(\alpha, n, p) s.$$

Hay otras intervalo de tolerancia procedimientos: estos no son los únicos.

Tomando nota de la similitud entre estos pares de fórmulas, podemos resolver la ecuación

$$k(\alpha, n) = K(\alpha', n, p).$$

Esto permite reinterpretar un intervalo de predicción como un intervalo de tolerancia (en muchas diferentes maneras posibles variando $\alpha'$$p$) o a reinterpretar un intervalo de tolerancia como un intervalo de predicción (sólo que ahora $\alpha$ generalmente está determinada únicamente por $\alpha'$$p$). Esto puede ser un origen de la confusión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X