2 votos

Hipótesis sobre las medias de dos distribuciones de Pareto

Tengo dos grupos independientes y parece que forman una distribución de Pareto cuando se observan los histogramas. ¿Existe alguna prueba de hipótesis específica para comparar las medias de estas distribuciones?

También debo mencionar que las distribuciones están muy desequilibradas (un grupo tiene 1.000 casos y el otro 35.000).

Quiero comprobar si la media de un grupo es mayor que la media del otro grupo.

4voto

AdamSane Puntos 1825

Con tamaños de muestra tan grandes, es seguro que rechazará la nula; puede que sea mejor centrarse en medir el tamaño de la diferencia que en probarla.

En el caso de que el límite inferior de ambas distribuciones de Pareto ( $x_m$ Parametrización de Wikipedia ) es el mismo, la prueba es sencilla: se trata de comprobar la igualdad de los valores de $\alpha$ parámetro.

La media, cuando existe, es $\frac{\alpha x_m}{\alpha-1}$ que aumenta a medida que $\alpha$ disminuye hacia 1.

Obsérvese que el logaritmo de una variable aleatoria de Pareto es una exponencial desplazada cuyo límite inferior (parámetro de desplazamiento) es $\log(x_m)$ y $\alpha$ es el parámetro de tasa. Así que vamos a proceder de esta manera -- trabajando con los registros.

En el caso de que $x_m$ es común a ambos grupos pero desconocido, podría estimar su logaritmo mediante la observación más pequeña de cualquiera de los grupos, restándola de todos los demás valores logarítmicos (y descartando después esa observación de la muestra en la que se haya producido).

A continuación, podría comparar las medias de los exponenciales resultantes mediante una prueba F, como aquí (la relación de las medias de los logaritmos desplazados $\bar{X}/\bar{Y}$ debe ser $\sim F_{2n_x,2n_y}$ ), o puede hacer una prueba directa de razón de verosimilitud. Deberían dar resultados muy similares (con tamaños de muestra considerablemente más pequeños que el suyo pueden diferir más).

2voto

Łukasz Bownik Puntos 2170

Pareto podría no tener una media finita, por lo que esta comparación podría no ser razonable.

Podrías hacer una simulación por bootstrapping a partir de tus muestras y hacerte una idea bastante aproximada de si un grupo es mayor que el otro.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X