2 votos

MAD y desviación estándar

¿Estoy en lo cierto al decir que sólo se puede utilizar la fórmula para aproximar la desviación estándar de la MAD, es decir

$$\text{SD } = K \times \text{ MAD }$$

si se conoce la distribución real de la probabilidad?

He visto en un post anterior que $K \approx 1.48$ para la distribución normal.

¿Qué es para la distribución de Poisson?

También he visto una expresión para $K = 1.25$ .

2voto

AdamSane Puntos 1825

Asumiré que estás interesado en la desviación absoluta de la mediana.

La relación SD/MAD es diferente para cada distribución.

Todas las distribuciones normales tienen la misma proporción, pero para las distribuciones de Poisson la proporción depende del parámetro de Poisson.

Tenga en cuenta que si sus datos son realmente Poisson, un intervalo de confianza real para el población sd ( $\sqrt{\lambda}$ ) se obtendría mejor generando un intervalo correspondiente para $\lambda$ (es decir, basado en la media de la muestra) y luego tomando las raíces cuadradas de los límites. Por ello, me centraré en utilizar $k\times$ MAD como una aproximación rápida para la DS de la muestra aunque muchos de los comentarios se trasladarían a su uso para estimar $\sqrt{\lambda}$ .

Resulta que para muestras grandes el valor asintótico de $k$ (que para lo normal) funciona bastante bien para una amplia gama de casos para $\lambda$ siempre que la muestra MAD no sea demasiado pequeña.

He realizado un pequeño estudio de simulación.

Por ejemplo, cuando simulé muestras de una gama muy amplia de $\lambda$ para n=100, encontré que $k=1.48$ era bastante buena, y que -siempre que la MAD fuera al menos 2,5- la desviación estándar de la muestra tendía a estar dentro de (0,8,1,3) $\times$ 1.48 $\times$ MAD más del 90% del tiempo (el rendimiento exacto depende de cómo distribuya su $\lambda$ pero no parecía muy sensible a ella). Probablemente me inclinaría por hacer $k$ sólo un poco más pequeño, pero la variación al respecto es bastante grande, así que realmente no importa mucho.

[ $k=1.48$ también era razonable para estimar la DE de la población, pero parece que los límites sugeridos tendrían que ser algo más amplios].

Sin embargo, para tamaños de muestra pequeños (por ejemplo, a n=10) la DAM fue muy variable y no funcionó bien; la desviación estándar casi siempre superará a la DAM, por lo que la propia DAM proporciona un buen límite inferior, pero a menos que la DAM fuera bastante grande, la DE de la muestra podría ser fácilmente 5 veces más grande que la DAM, y aunque no hay realmente ninguna buena opción de $k$ Probablemente querrá un valor menor que 1,48 cuando el MAD sea lo suficientemente grande como para probarlo.

En resumen: para muestras grandes y MAD de al menos 2,5, el valor normal ( $k=1.48$ ) parece ser adecuado. En el caso de muestras pequeñas o de una DAM inferior a 2,5, no me gustaría utilizar la DAM de esta manera, pero se puede suponer razonablemente que la DAM de la muestra es al menos $1\times$ MAD

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X