En R, la función skewness
del paquete moments
permite calcular la asimetría de la distribución de una muestra determinada. ¿Sabe alguien si existe una función lista para usar que permita calcular la asimetría de la distribución a partir de una muestra dada? histograma ?
Respuestas
¿Demasiados anuncios?Parece que estás mirando un histograma publicado y no tienes los datos reales.
En ese caso, se podría calcular un áspero la cifra de asimetría haciendo algo así como pub_his <- c(rep(10,16),rep(15,18),rep(20,27)...)
Si se toma el punto medio de cada barra y se lee la frecuencia en el gráfico, se tendrán los datos y se podrá utilizar la función de asimetría.
En el caso de la varianza (y de hecho para el cuarto momento central), el enfoque de "tomar el centro de la bandeja" conlleva un sesgo.
Este sesgo puede corregirse, a través de lo que se conoce como La corrección de Sheppard Por ejemplo, véase aquí , que en el caso de la varianza restaría $\frac{1}{12}$ del cuadrado de la anchura de la bandeja de la estimación del segundo momento. Sin embargo, en el caso del tercer momento, no es necesario este ajuste.
Por otro lado, el tercer momento asimetría si se calcula directamente dividiendo el tercer momento binizado por la varianza binizada no ajustada a la potencia $\frac{3}{2}$ dará lugar a un denominador demasiado grande, por lo que la asimetría estará en promedio ligeramente subestimada.
Esto sugiere que la varianza binada se ajuste mediante la corrección de Sheppard antes de calcular la asimetría. Por lo tanto:
1) Calcular los momentos de las binadas (primera, segunda, tercera) según sea necesario (es decir, tomando cada observación en su centro de la binada y, si es posible, utilizando las fórmulas de datos ponderados/agrupados).
2) corregir la varianza por el sesgo de agrupación
3) calcular la asimetría dividiendo el tercer momento agrupado por el segundo momento agrupado corregido.
Sin embargo, es posible que quiera reflexionar sobre las circunstancias en las que se aplican las correcciones. Por ejemplo, puede ver el análisis de las correcciones en Kendall y Stuart, o tal vez consultar
M. G. Kendall (1938),
Las condiciones de validez de las correcciones de Sheppard
Revista de la Real Sociedad de Estadística ,
Vol. 101, nº 3, p592-605
Aun así, dividir un numerador insesgado por un denominador insesgado no conduce por sí mismo a una proporción insesgada, incluso cuando son independientes, por lo que si una proporción realmente insesgada es de interés, se necesitaría un análisis adicional - pero generalmente tampoco nos preocupamos por eso cuando tratamos con la asimetría de la muestra ordinaria].