Basado en una muestra de $(x_i) \sim_{\text{iid}} {\cal N}(\mu, \sigma^2)$, ¿cómo se puede obtener un exacto o un aproximado superior de tolerancia límite (es decir, superior límite de confianza de un cuantil de la distribución) de $\dfrac{x_i}{\sigma}$ ? Aquí, asumimos que ambos parámetros $\mu$ $\sigma^2$ son desconocidos.
Respuestas
¿Demasiados anuncios?Maldita sea! Después de iniciar la recompensa me di cuenta de que la respuesta es fácil: El cuantil tiene forma de $\frac{\mu}{\sigma}+z_p$, y hay algunos métodos conocidos para obtener un intervalo de confianza sobre el "tamaño del efecto" $\frac{\mu}{\sigma}$ (o invirtiendo los límites de un intervalo de confianza sobre el coeficiente de variación; un intervalo de confianza está disponible en el paquete de R MBESS
).
En las Estadísticas Ambientales con S-Plus (CRC Press, 2001), Steven Millard y Nagaraj Neerchal estado que un
$\beta$-contenido intervalo de tolerancia con el nivel de confianza $(1-\alpha)100$% está construido de manera que contenga , al menos, $\beta 100$% de la población (es decir, la cobertura es de al menos $\beta 100$%) con una probabilidad de $(1-\alpha)100$%.
Citando varias fuentes (Wald & Wolfowitz 1946, Guttman 1970, Gibbons, 1994), que dan un aproximado de dos caras intervalo de tolerancia para $n$ observaciones en la forma habitual de (la media de la muestra) + $K$ (desviación estándar de la muestra) donde
$$K = r \sqrt{\frac{n-1}{\chi^2_{n-1, \alpha}}}.$$
Here, $\chi^2_{n-1,\alpha}$ is the $\alpha$ quantile of a chi-square distribution with $n-1$ degrees of freedom and $r$ solves the equation
$$\Phi(\frac{1}{\sqrt{n}} + r) - \Phi(\frac{1}{\sqrt{n}} - r) -\beta$$
(with $\Phi$ la Normal estándar CDF).
Wald y Wolfowitz (1946) muestran que esta aproximación es bastante buena, incluso para valores de $n$ tan pequeño como $2$, siempre y cuando ambos $\beta$ $1-\alpha$ son mayores de $0.95$. Además, Ellison (1964) muestra que, para esta aproximación, el error en el nivel de confianza es del orden de $1/n$.
Millard y Neerchal también discutir el caso más sencillo de un solo lado intervalo de tolerancia, donde $K$ está dado por
$$K = \frac{t_{n-1, z_\beta \sqrt{n}, 1-\alpha}}{\sqrt{n}}.$$
The notation $t_{\nu, \delta, p}$ refers to the $p^\text{th}$ quantile of the non-central Student t distribution with $\nu$ degrees of freedom and noncentrality parameter $\delta$, and $z_p$ refers to the $p^\text{th}$ quantile of the standard Normal distribution, $z_p = \Phi^{-1}(p)$. Esto responde directamente a la cuestión.
Software
Me ofrecen un Excel (VBA) macro para estos (Normal-teoría) los intervalos en una hoja de cálculo en http://www.quantdec.com/envstats/software/intervals.xls. Aunque no lo he probado, R
paquete de tolerancia parece ofrecer un amplio conjunto de intervalos de tolerancia (estas fórmulas deben ser modificados para aplicar a la regresión de los residuos, por ejemplo).
La no-central de la t de Student la distribución está disponible a través de la ncp
argumento a través de la qt
función (y sus familiares) que se encuentran en la base R
de la instalación.
Referencias
Wald, A., y J. Wolfowitz. (1946). Los Límites de tolerancia para una Distribución Normal. Anales de la Estadística Matemática 17, 208-215.
Guttman, I. (1970) Estadística Tolerancia Regiones: Clásica y Bayesiana. Hafner Publishing Co., Darien, CT.
(Omito los Gibones de referencia porque tiene errores tipográficos y no aporta nada esencialmente diferente.)