28 votos

Intervalo de confianza para la varianza dada una observación

Este es un problema de la "7ª prueba de Kolmogorov Estudiante de la Olimpiada en la Teoría de la Probabilidad":

Dada una observación de $X$ de $\operatorname{Normal}(\mu\sigma^2)$ de distribución con ambos parámetros desconocidos, dar un intervalo de confianza para $\sigma^2$, con un nivel de confianza de al menos el 99%.

A mí me parece que esto debería ser imposible. Tengo la solución, pero aún no lo ha leído. Los pensamientos?

Voy a publicar la solución en un par de días.

[Seguimiento de edición: solución Oficial publicado a continuación. El cardenal de la solución es más largo, pero da un mejor intervalo de confianza. Gracias también a Max y Glen_b para su entrada.]

19voto

giulio Puntos 166

Ver a través del lente de la probabilidad de las desigualdades y las conexiones a múltiples para la observación del caso, este resultado podría no parecer tan imposible, o, al menos, podría parecer más plausible.

Deje que $\renewcommand{\Pr}{\mathbb P}\newcommand{\Ind}[1]{\mathbf 1_{(#1)}}X \sim \mathcal N(\mu\sigma^2)$ con $\mu$ y $\sigma^2$ desconocida. Podemos escribir $X = \sigma Z + \mu$ para $Z \sim \mathcal N(0,1)$.

La Reivindicación principal: $[0,X^2/q_\alpha)$ $(1-\alpha)$ intervalo de confianza para $\sigma^2$, donde $q_\alpha$ es $\alpha$-nivel los cuantiles de una distribución chi-squared con un grado de libertad. Además, desde este intervalo tiene exactamente $(1-\alpha)$ cobertura cuando $\mu = 0$, es el más estrecho intervalo de la forma $[0,b, X^2)$ $b \in \mathbb R$.

Una razón para el optimismo

Recordar que en el $n \geq 2$ caso, con $T = \sum_{i=1}^n (X_i - \bar X)^2$, el típico $(1-\alpha)$ intervalo de confianza para $\sigma^2$ es $$ \Big(\frac{T}{q_{n-1,(1-\alpha)/2}}, \frac{T}{q_{n-1,\alpha/2}} \Big) \>, $$ donde $q_{k}$ es el $a$el nivel de los cuantiles de una chi-cuadrado con $k$ grados de libertad. Esto, por supuesto, vale para cualquier $\mu$. Aunque esta es la más popular en el intervalo (llamado la igualdad de cola intervalo por razones obvias), no es ni el único ni siquiera el más pequeño de ancho! Como debe ser evidente, otra selección válida es $$ \Big(0,\frac{T}{q_{n-1,\alpha}}\Big) \>. $$

Desde, $T \leq \sum_{i=1}^n X_i^2$, entonces $$ \Big(0,\frac{\sum_{i=1}^n X_i^2}{q_{n-1,\alpha}}\Big) \>, $$ también tiene una cobertura de al menos $(1-\alpha)$.

Visto bajo esta luz, que podría entonces ser optimistas de que el intervalo en el principal reclamo es cierto para $n = 1$. La principal diferencia es que no hay cero grados de libertad de la chi-cuadrado de distribución para el caso de una única observación, por lo que debemos esperar que el uso de un grado de libertad-cuantil de trabajo.

Un medio paso hacia nuestro destino (la Explotación de la cola derecha)

Antes de sumergirse en una prueba de la demanda principal, veamos primero una reclamación preliminar que no es tan fuerte o la satisfacción estadísticamente, pero tal vez le da una mayor comprensión de lo que está pasando. Puede pasar a la prueba de la demanda principal a continuación, sin mucho (si existe) de la pérdida. En esta sección y la siguiente, las pruebas mientras que un poco sutil—se basan sólo en los hechos elementales: la monotonía de las probabilidades, y la simetría y unimodality de la distribución normal.

Auxiliar de reclamación: $[0,X^2/z^2_\alpha)$ $(1-\alpha)$ intervalo de confianza para $\sigma^2$ mientras $\alpha > 1/2$. Aquí $z_\alpha$ es $\alpha$-nivel cuantil de una normal estándar.

Prueba. $|X| = |-X|$ y $|\sigma Z + \mu| \stackrel{d}{=} |-\sigma Z+\mu|$ por simetría, por lo que en lo que sigue nos puede llevar $\mu \geq 0$ sin pérdida de generalidad. Ahora, por $\theta \geq 0$ y $\mu \geq 0$, $$ \Pr(|X| > \theta) \geq \Pr( X > \theta) = \Pr( \sigma Z + \mu > \theta) \geq \Pr( Z > \theta/\sigma) \>, $$ y así, con $\theta = z_{\alpha} \sigma$, vemos que $$ \Pr(0 \leq \sigma^2 < X^2 / z^2_\alpha) \geq 1 - \alpha \>. $$ Esto sólo funciona para $\alpha > 1/2$, ya que es lo que se necesita para $z_\alpha > 0$.

Esto demuestra la auxiliar de reclamación. Mientras ilustrativo, es unsatifying desde un punto de vista estadístico, ya que requiere una absurdamente grande $\alpha$ a trabajar.

Probando el principal reclamo

Un refinamiento del anterior argumento conduce a un resultado que se va a trabajar para una arbitraria de nivel de confianza. En primer lugar, tenga en cuenta que $$ \Pr(|X| > \theta) = \Pr(|Z + \mu/\sigma| > \theta / \sigma ) \>. $$ $A = \mu/\sigma \geq 0$ y $b = \theta / \sigma \geq 0$. A continuación, $$ \Pr(|Z + a| > b) = \Phi(a-b) + \Phi(-a-b) \>. $$ Si podemos demostrar que el lado derecho aumenta en $un$ para todos los fijos $b$, entonces podemos emplear un argumento similar como en el argumento anterior. Esto es al menos plausible, ya que nos gustaría creer que si la media aumenta, entonces se convierte en más probable que veamos un valor con un módulo que supera los us $b$. (Sin embargo, tenemos que mirar hacia fuera para la rapidez de la masa es la disminución en la cola izquierda!)

$F_b(a) = \Phi(a-b) + \Phi(-a-b)$. Entonces $$ f'_b(a) = \varphi(a-b) - \varphi(-a-b) = \varphi(a-b) - \varphi(a+b) \>. $$ Tenga en cuenta que $f'_b(0) = 0$ y positivo de $u$, $\varphi(u)$ es la disminución en $u$. Ahora, para que $a \in (0,2 b)$, es fácil ver que $\varphi(a-b) \geq \varphi(-b) = \varphi(b)$. Estos hechos tomados de la mano fácilmente implica que $$ f'_b(a) \geq 0 $$ para todo $a \geq 0$ y cualquier fijo de $b \geq 0$.

Por lo tanto, hemos demostrado que, para que $a \geq 0$ y $b \geq 0$, $$ \Pr(|Z + a| > b) \geq \Pr(|Z| > b) = 2\Phi(-b) \>. $$

Desentrañar todo esto, si tenemos $\theta = \sqrt{q_\alpha} \sigma$, obtenemos $$ \Pr(X^2 > q_\alpha \sigma^2) \geq \Pr(Z^2 > q_\alpha) = 1 - \alpha \>, $$ el cual establece que la demanda principal.

El cierre de comentario: Una lectura cuidadosa del argumento anterior muestra que se utiliza sólo el simétrica y unimodal propiedades de la distribución normal. Por lo tanto, el enfoque que funciona de forma análoga para la obtención de intervalos de confianza a partir de una sola observación de cualquier simétrica unimodal de ubicación a escala de la familia, por ejemplo, de Cauchy o de Laplace de las distribuciones.

13voto

El tiempo de seguimiento! Aquí está la solución que me dieron:

Vamos a construir un intervalo de confianza de la forma $[0,T(X))$, donde $T(\cdot)$ es algo de estadística. Por definición, este será un intervalo de confianza con nivel de confianza de al menos el 99% si $$(\forall \mu \in \mathbb R )(\forall \sigma > 0)\; \mathbb P_{\mu\sigma_2}(\sigma^2 > T(X)) < 0.01.$$ Tomamos nota de que la densidad de la $\mathcal{N}(\mu\sigma^2)$ de distribución no exceda de $1/\sigma\sqrt{2\pi}$. Por lo tanto, $\mathbb{P}(|X| \leq a) \leq un/\sigma$ para todo $a \geq 0$. De ello se sigue que $$t \geq \mathbb P (|X|/\sigma \leq t) = \mathbb P (X^2 \leq t^2\sigma^2) = \mathbb P (\sigma^2 \geq X^2/t^2).$$ Enchufar $t = 0.01$, obtenemos que la correspondiente estadística es de $T(X) = 10000X^2.$

El intervalo de confianza (que es muy amplia) es un poco conservador en la simulación, con ninguna base empírica de la cobertura (en 100.000 simulaciones) inferior a 99.15% como he variado el CV a través de muchos órdenes de magnitud.

Para la comparación, yo también simulado del cardenal intervalo de confianza. Debo señalar que el cardenal del intervalo es un poco más estrecho-en el 99% de los casos, su termina siendo hasta cerca de $6300X^2$, frente a los $10000X^2$ en la solución aportada. Empírica de la cobertura es a la derecha en el nivel nominal, de nuevo a lo largo de muchos órdenes de magnitud para el CV. Así que su intervalo definitivamente gana.

No he tenido tiempo de mirar cuidadosamente el papel de Max publicado, pero no tengo plan para ver que puede agregar algunos comentarios con respecto a esto más tarde (es decir, no antes de una semana). Que las reclamaciones por escrito un 99% de intervalo de confianza de $(0,4900 X^2)$, lo que ha empírica de la cobertura ligeramente menor (alrededor de 98.85%) de la nominal de la cobertura de grandes CVs en mi breve simulaciones.

8voto

jasonmray Puntos 1303

La CI $(0,\infty)$ presumiblemente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X