5 votos

En la estimación de una función de distribución acumulativa de un modelo de mezcla de

Tengo un problema no he podido encontrar una solución.

Asumir un modelo de mezcla de :

$F(x)=a\times G(x)+(1-a)\times H(x)$

donde $F$, $G$ y $H$ son distribuciones acumulativas de diferentes variables aleatorias, y $a$ es un peso ($\in[0,1]$).

Suponga que sé $a$ y soy capaz de estimar el empírica funciones de distribución acumulativa (ecdf) de $F$ $G$ que tomo nota de $\hat{F}$$\hat{G}$. Mi pregunta es :

¿Cómo puedo calcular correctamente $H$ ?

Por ejemplo, si yo uso $\hat{H}(x)=\frac{\hat{F}(x)-a\hat{G}(x)}{1-a}$

entonces no estoy seguro de que $\hat{H}(x)$ será una función creciente entre 0 y 1. Normalmente, la expectativa de $\hat{H}(x)$$H(x)$, pero esta estimación no respeta las propiedades de una función de distribución acumulativa...

Mi idea era empezar de $\hat{H}(x)$ y, a continuación, la estimación de una función de distribución acumulativa de estos puntos. Sin embargo, me gustaría hacer como pocos como sea posible hipótesis. ¿Sabe usted si hay un método para ese problema?

Gracias

7voto

md1337 Puntos 133

Tales modelos de mezcla son un lugar destacado en la teoría de múltiples pruebas. Aquí de nuevo hay una mezcla; el llamado "dos grupos" del modelo. El grupo corresponde a las hipótesis extraídas de la nula distribución y el otro a la hipótesis extraídas de la distribución alternativa. De hecho, hay gente lo suficientemente loco como para intentar estimar tanto $G$ $H$ $\alpha$ a partir de la misma muestra! Esto es a menudo llamado empírica null modelado y era esencialmente iniciada por el Prof. Bradley Efron. Uno de los supuestos para hacer ese tipo de modelado es que $\alpha > 0.9$, pero estoy divagando. Mi punto principal de este párrafo es que usted puede encontrar un montón de inspiración para responder a su pregunta en las múltiples pruebas de la literatura; y voy a intentar hacerlo a continuación.

Lo que la gente realmente por lo general terminan asumiendo en las múltiples pruebas de la literatura es que la distribución bajo la hipótesis nula (dicen que es $G$) es conocido. Después, usando la notación (es decir, $\hat{F}(x)$ es el ECDF), se puede estimar $H$ como sigue:

$$\hat{H}(x)=\frac{\hat{F}(x)-aG(x)}{1-a}$$

Esta como dices es imparcial y consistente, pero no una función de distribución! En uno de mis favoritos de preprints, Bodhisattva Sen y Rohit Kumar Patra tratar de mejorar la estimación, mediante la imposición de exactamente la misma condición que hablaron!

En particular, vamos a $X_1, \dotsc, X_n \sim F$ de las observaciones de $F$ y supongamos por ahora que $\alpha$ es conocido. Luego de resolver el siguiente problema de optimización:

$$ \displaystyle\min_{W \text{ CDF}} \sum_{i=1}^n (W(X_i)-\hat{H}(X_i))^2$$

El argmin de la de arriba es nuestro nuevo estimador $\tilde{H}$, lo que en realidad es una función de distribución! En otras palabras, se proyecto el ingenuo estimador $\hat{H}$ sobre el espacio de funciones de distribución y por lo tanto mejorar la estimación. Ellos muestran que este es un convexo problema que puede ser resuelto con PAVA (piscina adyacente para el infractor algoritmo) y, a continuación, se derivan de un montón de buena asintótico de las propiedades de este estimador.

También ir un poco más allá y mostrar cuándo y cómo también se puede estimar el $\alpha$ cuando no se conoce (no siempre identificable) y demostrar los resultados para que así, aunque en el caso de que usted ya sabe.

Así que, básicamente, creo que sólo puede aplicar este método con $G(x)$ reemplazado por $\hat{G}(x)$. De hecho, debido a que la estimación de $G$ basado en datos independientes, estoy bastante seguro de que usted también puede adaptar todos sus asintótica consistencia de los resultados para el caso en el que también están estimación de $G$ por su ECDF.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X