La mayoría de las desigualdades de concentración hablan de la desviación de la media muestral de la media poblacional. ¿Hay un resultado que limite la probabilidad de desviación de la mediana de la muestra con respecto a la mediana de la función de densidad?
Respuestas
¿Demasiados anuncios?La más eficaz manera de obtener la concentración de resultados en la mediana es isométrico de la desigualdad. Básicamente dice que, de todas formas geométricas con igual área que el círculo tiene el menor perímetro. Pero cuando este resultado se generaliza a una alta dimensión espacio métrico con una medida de probabilidad, usted puede obtener algunos resultados inesperados llamado "medida de la concentración".
El más famoso de la desigualdad isoperimétrico tal vez el Talagrand la concentración de la desigualdad. La desigualdad indica que si $\Omega=\Omega_1\times\ldots\times\Omega_n$ es un producto de espacio dotado de un producto de la probabilidad de medir y $A$ es un subconjunto en este espacio, entonces para cualquier $t>0$, hay $$ \Pr[A] \cdot \Pr\left[\overline{A_t}\right] \le e^{-t^2/4} \, , $$ Usted puede referirse a la página de la wikipedia para obtener la definición rigurosa de los símbolos en la desigualdad anterior.
De la desigualdad anterior, podemos llegar a una importante conclusión: la mayoría de probabilidad de masa (la medida!) se concentra en los eventos con una probabilidad de al menos $1/2$. Para una explicación intuitiva, considere la posibilidad de $f(X_1,\ldots,X_n)=\sum_{i=1}^nX_i$ donde $X_i$'s son independientes de las variables aleatorias.Y deje $A=\{X\,|\,f(X)\leq M[f]\}$ donde $X=(X_1,\ldots,X_n)$, e $M[f]$ representa la mediana de $f$. Luego de Talagrand la desigualdad podemos obtener los siguientes resultados: $$ \Pr[A]\cdot\Pr[X|f(X)>M[f]+t]\leq e^{-t^2/(4n)}\, . $$ A continuación, a partir de la definición de la mediana sabemos $\Pr[A]\geq 1/2$, por lo que finalmente hemos $$ \Pr[X|f(X)>M[f]+t]\leq 2e^{-t^2/(4n)}\, , $$ una concentración en la mediana de resultado. He omitido muchos detalles en la prueba y puede referirse a McDiarmid agradable encuesta para ver los detalles de la prueba.
Supongamos que la muestra ha $k$ elementos, que $M$ es la mediana, y que en su distribución de un único elemento supera $M+t$ con una probabilidad de $p_t$ (dependiendo de la $t$).
Entonces la probabilidad de que su mediana es, al menos, $M+t$ es la probabilidad de que $k$ ensayos de Bernoulli independientes, cada uno con probabilidad de éxito $p_t$, entre uno de ellos, al menos, $(k+1)/2$ éxitos (si $k$ es impar. Si $k$ es incluso puede reemplazar $(k+1)/2$ $k/2$ a una cota superior de la probabilidad). Usted puede utilizar la concentración de las desigualdades de la distribución Binomial (por ejemplo, la Chernoff bound) para limitar la probabilidad de que esto ocurre en términos de $p_t$.