9 votos

¿Cuál es la media y la varianza de la mediana de un conjunto de variables aleatorias normales i.i.d?

Que sean $X_1$, ..., $X_n$ variables aleatorias idénticamente distribuidas independientes con $N(\mu, \sigma^2)$

Es fácil de demostrar que la media muestral $\bar{X} = \frac{1}{n}\sum^n_{i = 0}{X_i}$ es una variable aleatoria con $N(\mu, \frac{\sigma^2}{n})$.

Sin embargo, estoy teniendo dificultades para encontrar cuál es la distribución de la mediana muestral $mediana(X)$, especialmente en términos de su media y varianza.

Pregunto esto porque estoy tratando de resumir algunas características en grupos predefinidos para reducir la cantidad de pruebas que tengo que hacer entre dos condiciones.

Si no hay una respuesta simple a esto, como sospecho, estaría interesado en saber la varianza de $mediana(X)$, especialmente en cómo difiere de $\bar{X}$.

4 votos

Relacionado, para la normalidad asintótica a través del TCL: Teorema del límite central para medianas muestrales

2 votos

Para la expectativa, recuerda que la mediana de $n$ normales iid es la estadística de orden $n/2$ y mira aquí: Estadísticas de orden aproximadas para variables aleatorias normales

8voto

Eero Puntos 1612

La mediana es la estadística de orden central cuando el número de observaciones es impar. Si $n$ es par, entonces la mediana es either an order statistic, or the mean of 2 order statistics (or something else) depending on which definition of median you use.

Entonces, la distribución exacta de la mediana se puede calcular en función de la distribución de las estadísticas de orden. Para $n$ impar donde todos los $x$ son iid de una pdf $f$ con distribución acumulada $F$, la distribución de la mediana es:

$\binom{n-1}{(n-1)/2} F(x)^{\frac{n-1}2} f(x) (1-F(x))^{\frac{n-1}2}$

Puedes buscar "distribución de las estadísticas de orden" para obtener más detalles y derivación.

Para la distribución normal no tenemos una solución en forma cerrada para $F(x)$, pero hay herramientas computacionales que pueden ayudar a estimar lo anterior (ver el paquete distr para R como una posibilidad).

Si tu objetivo principal es solo una estimación de la varianza de la mediana, entonces un enfoque más simple es simplemente simular un montón de conjuntos de datos y calcular la varianza de sus medianas (y la varianza de sus medias para comparación).

El artículo de Wikipedia sobre "Mediana" también tiene información que puede ser de interés.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X