Tengo 100 puntos de datos de un proceso aleatorio. ¿Cómo puedo colocar un intervalo de confianza alrededor de la estimación de $\Pr(X>x)$? La función de distribución es desconocido y positivamente sesgada. Mi primera inclinación sería utilizar un sistema de arranque basado en el material leído para esta clase, pero ¿existe alguna otra forma de hacer esto?
Respuesta
¿Demasiados anuncios?Sí, hay otros tipos de intervalos de confianza (IC). Uno de los más populares de la CI se basa en la Dvoretzky–Kiefer–Wolfowitz la desigualdad, la cual establece que
$$P\left[\sup_{x}\vert \hat{F}_n(x)-F(x)\vert>\epsilon\right]\leq 2\exp(-2n\epsilon^2).$$
Entonces, si usted quiere construir un intervalo de nivel de $\alpha$ usted sólo tiene que equiparar $\alpha=2\exp(-2n\epsilon^2)$, lo que conduce a $\epsilon = \sqrt{\dfrac{1}{2n}\log\left(\dfrac{2}{\alpha}\right)}$. En consecuencia, una banda de confianza para$F(x)$$L(x)=\max\{\hat{F}_n(x)-\epsilon,0\}$$U(x)=\min\{\hat{F}_n(x)+\epsilon,1\}$. Puede que desee trabajar en los detalles y en la adaptación de este a $P[X>x]=1-F(x)$ (ya que has etiquetado a esto como un auto-estudio).
Esta presentación proporciona otros detalles que puedan ser de su interés.