1 votos

Fórmula para la esperanza condicional en una muestra binomial

Tomemos $N$ variables estocásticas i.i.d. $X_i$ donde $X_i \sim Bin(n,p)$ .

Inspirándose en aquí , deberíamos tener los siguientes datos:

  1. $Var(X_i)=np(1-p)$ .
  2. Estadísticas de la muestra $M(X_1,...,X_n)=\frac{\sum_i X_i}{N}$ es una estadística suficiente y completa.
  3. El estimador MLE para $np(1-p)$ es $T_{MLE}=nM(1-M)$ .

Combinando estos puntos tenemos que el $T_{MLE }$ también es UMVUE por el Lema de Lehmann-Scheffe .

Ahora tenemos también el siguiente hecho:

  1. La varianza (corregida) de la muestra $S^2=\frac{1}{N-1}\sum_i{(X_i-M)^2}$ es una estimación insesgada de $Var(X_i)$ .

De Lehmann-Scheffe' deberíamos tener entonces por coherencia:

$$E[S^2\mid M]=nM(1-M)$$

Mis preguntas:

  • ¿Es correcto mi razonamiento o estoy aplicando algún teorema de forma equivocada?

  • Si el razonamiento es correcto, ¿cuál sería una derivación directa del resultado final? ¿Es la fórmula trivial por alguna razón que ahora no veo?

1voto

StubbornAtom Puntos 188

Tu razonamiento es correcto excepto que MLE no es la UMVUE de la varianza poblacional.

Una estadística suficiente completa para $p$ es $T=\sum\limits_{i=1}^N X_i$ que tiene un $\mathsf{Bin}(nN,p)$ distribución.

Ahora $E_p[T]=nNp$ y $\operatorname{Var}_p[T]=nNp(1-p)$ para todos $p\in(0,1)$ .

Otra vez, $$E_p[T^2]=\operatorname{Var}_p[T]+(E_p[T])^2=nNp(1-p)+n^2N^2p^2$$

O, $$E_p[T^2-T]=nNp^2(nN-1)$$

Eso es, $$E_p\left[\frac{T(T-1)}{N(nN-1)}\right]=np^2$$

Así que tienes un estimador insesgado de la varianza de la población basado en $T$ (y, por tanto, UMVUE):

$$E_p\left[\frac TN-\frac{T(T-1)}{N(nN-1)}\right]=np-np^2=np(1-p)\quad,\forall\,p\in(0,1)$$

Con $\overline X=\frac TN$ la varianza muestral $S^2=\frac1{N-1}\sum\limits_{i=1}^N (X_i-\overline X)^2$ es insesgada para la varianza de la población. Así que por Lehmann-Scheffe, $E\left[S^2\mid T\right]$ es también UMVUE de $np(1-p)$ .

Como UMVUE es único siempre que existe, se puede decir

$$E\left[S^2\mid T\right]=\frac TN-\frac{T(T-1)}{N(nN-1)}\tag{*}$$

Esto puede reescribirse en términos de $\overline X$ por supuesto.


Una forma directa de obtener $(*)$ sería proceder utilizando la linealidad de la expectativa.

Creo que debería ser algo como

\begin{align} E\left[S^2\mid T=t\right]&=E\left[\frac{1}{N-1}\sum_{i=1}^N\left(X_i-\frac tN\right)^2\mid T=t\right] \\&=E\left[\frac{1}{N-1}\left(\sum_{i=1}^N X_i^2-\frac{t^2}{N}\right)\mid T=t\right] \\&=\frac{1}{N-1}\sum_{i=1}^N E\left[X_1^2\mid T=t\right]-\frac{t^2}{N(N-1)} \end{align}

Ahora sólo tenemos que recordar que $X_1$ condicionado a $T$ tiene una distribución hipergeométrica.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X