7 votos

Estimación de la probabilidad de un éxito en la distribución binomial

Digamos que tenemos dos sesgada monedas. La probabilidad de lanzar una cabeza en la primera moneda es $\alpha$ y la probabilidad de lanzar una cabeza en la segunda moneda es $1-\alpha$. Tiramos de monedas, $n$ veces y nos dicen que no es un éxito cuando hay una cabeza en ambas monedas. Si denotamos esta variable aleatoria por $X$

$$X\sim B(n,\alpha-\alpha^2).$$

La pregunta es cómo estimar correctamente $\alpha$. El problema con un 'estándar' enfoque ($\alpha - \alpha^2=\frac{k}{n}$ donde $k$ es el número de éxitos) es que el número de éxitos puede ser mayor que $0.25n$, y en tal caso obtenemos que $\alpha$ es un número complejo. Podemos tratar casos como el de $\alpha=0.5$, pero luego de este estimador no es imparcial ya.

8voto

jldugger Puntos 7490

El estimador es sesgado, independientemente.

Nota primero que $\alpha$ no es identificable porque no se puede distinguir entre el$\alpha$$1-\alpha$. Vamos a dar cabida a este problema al permitir que no nos importa que la moneda es que, y que disponga (arbitrariamente, pero sin pérdida de generalidad), que $0 \le \alpha \le 1/2$.

Es razonable, y convencionales, para corregir el estimador $g$ como sigue:

$$\eqalign{ g(k,n) =& \frac{1 - \sqrt{\delta}}{2} \cr \delta =& \max(0, 1 - 4 k / n) }$$

No importa lo que hagas, sin embargo, esto va a ser una función no lineal de los resultados $k$ y por lo tanto, va a ser sesgada para casi todos los $\alpha$.

Un mejor enfoque es la búsqueda de estimadores $h(k,n)$ entre algunos de la clase funcional de los estimadores (tales como aquellos que son lineales en $k$) que minimizan la expectativa de alguna función de pérdida. En muchas situaciones un estimador que funciona bien para la pérdida cuadrática también funciona bien para muchos tipos razonables de pérdidas, así que echemos un vistazo a esto. De qué estamos hablando, entonces, es (para cada una de las $n$) para minimizar la expectativa $\mathbb{E}[(h(k,n) - \alpha)^2]$ entre todos los estimadores $h$.

Vamos a ver gráficamente en lo que está pasando. El sesgo de cualquier estimador $h$ del parámetro $\alpha$ es la diferencia entre sus expectativas y el parámetro de $\mathbb{E}[h(k,n) - \alpha]$. Podemos estudiar cualquier propuesta estimador, entonces, graficando su sesgo (si realmente nos preocupamos por que) y de su pérdida. Para cualquier valor de $n$ son funciones de $\alpha$, que (por supuesto) es desconocida. Es por eso que tenemos que buscar en todo el gráfico.

Aquí está el sesgo (a rayas azul) y la raíz cuadrada de la pérdida esperada cuadrática (rojo) por $g$ al $n=16$:

alt text

(Yo uso la raíz de la pérdida, ya que esta es directamente comparable con el prejuicio.) Por ejemplo, $g$ es imparcial para $\alpha \approx 1/3$ pero por lo demás es sesgada, con el tamaño de la tendencia más grande para $\alpha = 1/2$. La raíz de la pérdida esperada es de aproximadamente entre 0.15 y 0.2 proporcionado $\alpha$ supera $1/6$, aproximadamente.

Como alternativa, considere lineal estimadores $h_\lambda(k,n)$ de la forma $h_\lambda(k,n) = \lambda(n) k/n$. Aquí está una parcela de $h_2$ $n=16$ (pero tenga en cuenta el cambio de escala en el eje vertical):

alt text

Para la mayoría de las $\alpha$ su sesgo supera a la de $g$, pero para algunos de $\alpha$ (cerca de 0.4) en realidad tiene menos prejuicios. Para una amplia gama de $\alpha$, sin embargo, la raíz de la pérdida esperada es menor que la de $g$. Siempre $\alpha \gt 1/5$ o así, este simple estimador claramente supera a la de "obvio"!

Esto no es necesariamente "mejor" estimador lineal, sin embargo. Para ilustrar, aquí es un gráfico de $h_{4/3}$:

alt text

Supera a ambos $g$$h_2$$1/8 \lt \alpha \lt 3/8$, aproximadamente. Nota, sin embargo, que $g$ supera el $h_{\lambda}$ suficientemente pequeño $\alpha$.

Estas consideraciones sugieren que existe valor en saber algo acerca de lo $\alpha$ podría ser: que dirá usted que las partes de la pérdida de gráficos para centrarse en la selección entre alternativas de estimadores. Si, además, tiene una distribución previa para$\alpha$, se puede calcular la pérdida esperada (este es ahora un único número) y el uso que comparar estimadores: su tarea se convierte en uno de encontrar un estimador con menor posible pérdida esperada. Esto, por supuesto, es un Bayesiano estimador.

Independientemente, utilizando parcelas de la pérdida esperada es un estándar y más eficaz manera de comparar los estimadores y elija aquellas que son apropiadas para cualquier tipo de problema en particular.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X