5 votos

Condiciones técnicas para la validez de los intervalos de confianza bootstrap no paramétricos

Soy bastante ignorante sobre la no paramétrica de bootstrap. Asumir el mismo contexto que en esta pregunta: ${(x_i)}_{i=1}^m$ ${(y_i)}_{i=1}^n$ son independientes de los datos de las muestras, el $x_i$ son repeticiones independientes de una distribución con expectativa $\mu_X$ y de manera similar a la $y_i$ son repeticiones independientes de una distribución con expectativa $\mu_Y$. Estimamos que la proporción de $\theta=\mu_X/\mu_Y$ por la relación $\hat\theta = \bar x / \bar y$ de la muestra dos medios. En virtud de que las condiciones de los cuantiles de la boostrap muestras de $\hat\theta$ proporcionar un válidos intervalo de confianza acerca de $\theta$ ? No, no estoy interesado en las mejores condiciones técnicas requeridas (como $L^{1+\epsilon}$-integrabilidad de la condición), sino en la más fácil de las condiciones que sean razonables para suponer para el común de los conjuntos de datos reales.

EDIT: no, no estoy interesado en trivial contra-ejemplos. Por ejemplo, supongo que el la $y_i$ no puede ser negativo (con el apoyo de su distribución es de un intervalo de estrictamente números positivos) y el desconocido distribuciones discretas y continuas de las distribuciones.

EDIT: tal vez lo que yo esperaría a entender es más claro si puedo hacerle una pregunta diferente : suponiendo que el anterior 'editar' y fuertes de la distribución supuestos (como $L^2$), bajo que condiciones, tenemos válido bootstrap intervalo de confianza acerca de $f(\mu_X,\mu_Y)$ para una adecuada función de $f$ cuando se utiliza el bootstrap muestras de la estimación de $f(\bar x, \bar y)$ ? Es el unbiasedness de esta estimación de una condición obligatoria ?

2voto

mat_geek Puntos 1367

En su libro, Una Introducción a los archivos de inicio (Chapman y Hall, Nueva York, 1994), Efron y Tibshirani dar un ejemplo de la estimación de una relación con la revisión del estudio de los datos. El cociente de las medias es una estimación sesgada de la media de la ratio. Así Efron y Tibshirani el uso de los datos de la revisión de mostrar cómo el proceso de arranque puede corregir este sesgo.

Estos datos se basan en un ensayo clínico cuando el efecto de un parche hormonal producido en una nueva planta de fabricación se compara con el efecto de la edad (aprobado) de la planta de fabricación. El parámetro de interés en este problema es

$$\theta = \frac{E(\text{new})-E(\text{placebo})}{E(\text{old})-E(\text{placebo})}.$$

$E(.)$ es el nivel esperado de la hormona en el torrente sanguíneo por la "nueva" = parche producido en la nueva planta, "edad" = parche producido en el aprobado de la planta, y "placebo" = parche sin hormonas.

La FDA requisito para la aprobación de la nueva planta de fabricación es que el nuevo parche produce al menos el 80% de los efectos de que el viejo parche producido sobre el placebo. Así que la idea es calcular la $\theta$ y mostrar a través de un intervalo de confianza (o de la prueba de hipótesis) que es mayor que 0.80; o, equivalentemente, que el $1-\theta$ es de 0.20.

En este problema el numerador y el denominador tienen ambas distribuciones se concentró en el positivo de la mitad de la recta real y la apartó de 0. Así que el problema que el proyecto de Ley Huber mencionado no se produce. En el libro, Efron y Tibshirani calcular el sesgada estimación de punto, junto con su bootstrap estimación de sesgo. Ellos muestran que la corrección de sesgo de la estimación de $1-\theta$ está muy por debajo de 0.20. Bootstrap intervalos de confianza podría ser utilizado para este por de nuevo por separado arranque de las dos muestras y el cálculo de la relación de las estimaciones, decir $B$ veces, por Monte Carlo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X