1 votos

Intervalo de confianza asintótico y exacto

Supongamos que lanzamos una tachuela 300 veces. Después de cada lanzamiento, anotamos $1$ si cae con la punta hacia arriba o $0$ si cae con la punta hacia abajo. En resumen, obtenemos 124 veces el resultado $1$.

Así que sabemos que el número de veces con el resultado $1$ es $\sim Bin(300,p)$ con un parámetro $p$ desconocido. Además, $\mathcal X:=[0,1]^{300}$, $\Theta:=[0,1]$, $p \in \Theta$ (¿esto es correcto?)

Ahora viene la tarea:

Define el término 'intervalo de confianza asintótico y exacto' para el nivel $1-\alpha>0$. Proporciona un intervalo de confianza del $95\%$ para la probabilidad de que la tachuela caiga con la punta hacia arriba.

Tengo las definiciones formales del intervalo de confianza asintótico y exacto, pero no las entiendo realmente. ¿Alguien podría explicármelas haciendo referencia a este ejemplo específico?

Las definiciones son:

$Definición$

Sea $(\mathbb P_\theta)_{\theta \in \Theta}$ un modelo estadístico con $\Theta \subset \mathbb R^n$ en el espacio muestral $\mathcal X$. Un parámetro real es una asignación $\gamma: \Theta \to \mathbb R$. Una asignación de valores de intervalo $$I:\mathcal X \to \mathcal P(\mathbb R), I(x)=[U(x),O(x)]$$ con las estadísticas $U,O: \mathcal X \to \mathbb R$ con $U \le O$ se llama una estimación por intervalo para el parámetro $\gamma$.

$Definición$

La probabilidad de cobertura de una estimación por intervalo $I$ para un parámetro $\gamma$ es la asignación $$\theta \to \mathbb P_\theta (\{x \in \mathcal X: \gamma(\theta) \in I(x)\}), \theta \in \Theta$$ Un nivel de confianza de una estimación por intervalo es la probabilidad de cobertura mínima $$\inf_{\theta \in \Theta} \mathbb P_\theta(\gamma(\theta) \in I(x))$$

$Definición$

Una estimación por intervalo $I$ se llama intervalo de confianza (exacto) para el nivel de confianza $1-\alpha$ (para un $\alpha$ fijo en $[0,1]$), si $$\forall \theta \in \Theta: \mathbb P_\theta(\gamma(\theta)\in I(x)) \ge 1-\alpha$$

$Definición$

Para todo $n \ge n_0$ dejemos que $I_n$ sea una estimación por intervalo en $\mathcal X^n$. Una secuencia $(I_n)_{n \ge 1}$ de estimadores por intervalo se llama intervalo de confianza asintótico para el nivel de confianza $1-\alpha$, si $$\forall \theta \in \Theta: {\lim \inf}_{n\to\infty}P^{\otimes n}_\theta(\{x\in\mathcal X^n:\gamma(\theta)\in I_n(x)\}) \ge 1-\alpha$$

2voto

wxs Puntos 1546

En tu contexto, estás buscando definir un intervalo de confianza para el parámetro $p$ asociado con una distribución de Bernoulli (es decir, la probabilidad verdadera $p$ de que un alfiler de corcho caiga con la punta hacia arriba).

Afortunadamente, debido a la relación entre las variables de Bernoulli y Binomial, al observar esto es equivalente a encontrar un intervalo de confianza para el parámetro $p$ de una distribución $\text{Bin}(n,p)$ (con $n=300$ en tu caso), basado en el resultado observado ($X = 124$, en tu caso).

Para una distribución Binomial, hay un ejemplo estándar de un intervalo de confianza exacto (1-$\alpha$), llamado el intervalo de Clopper-Pearson. Este tiene una fórmula un tanto complicada, y se da por

$$I_{\alpha} = \bigg( {\textstyle B\left(\frac{\alpha}{2}; X; n - X + 1\right), \, B\left(1-\frac{\alpha}{2}; X+1; n - X \right)} \bigg) ,$$

aquí $B(r\,;v,w)$ denota la función percentil de una distribución Beta con parámetros de forma $v,w$. Para ti, imagino que no importa qué es esta función. En tu caso particular, el intervalo es con $\alpha = 0.05$ (es decir, un intervalo de confianza del 95%)

$$I_\alpha = \big( {\textstyle B\left(0.975; 125, 177\right), B\left(0.025; 124, 176\right)} \big) = (0.3570, 0.4714).$$ Este es un intervalo de confianza exacto: lo que significa que se garantiza que al menos el 95% del tiempo el parámetro verdadero estará dentro del intervalo que calculas.

Como ejemplo de un intervalo de confianza asintótico podemos usar la aproximación normal estándar a la distribución binomial, y el intervalo de confianza asociado intervalo de aproximación normal. Denotando $\hat p = X/n$, este intervalo está dado por

$$J_\alpha = \hat p \pm \Phi^{-1}\left(1 - \frac{\alpha}{2} \right) \sqrt{\frac{\hat p (1 - \hat p)}{n} }, $$ donde $\Phi$ es la distribución acumulativa de una distribución normal. En tu ejemplo, esto da el intervalo $$J_\alpha = (0.3576,0.4691).$$

La diferencia con este intervalo es que no podemos decir con certeza que el 95% del tiempo el resultado estará en este intervalo. En particular, cuando $n$ es pequeño, esto no será cierto, pero a medida que $n$ aumenta, se acerca cada vez más a ser cierto que el 95% de las observaciones caerían en el intervalo. Para ver por qué esta fórmula no funciona para $n$ pequeñas, supongamos que sabemos que $p = 1/2$, y supongamos que hacemos un lanzamiento, $n=1$. Si esto cae con la punta hacia arriba, entonces el intervalo que obtendríamos (de la fórmula anterior) sería $J_\alpha = [1,1]$, mientras que si no cae con la punta hacia arriba sería $J_\alpha = [0,0]$. En cualquier caso, la probabilidad de que el valor verdadero caiga en el intervalo $J_\alpha$ es claramente $0$ (ya que $p = 1/2`). es decir, la respuesta no cae en el intervalo el 95% del tiempo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X