6 votos

¿Cómo calcular la asimetría de los datos a partir del histograma en R?

En R, la función skewness del paquete moments permite calcular la asimetría de la distribución de una muestra determinada. ¿Sabe alguien si existe una función lista para usar que permita calcular la asimetría de la distribución a partir de una muestra dada? histograma ?

5voto

Sunil Rana Puntos 9

Parece que estás mirando un histograma publicado y no tienes los datos reales.

En ese caso, se podría calcular un áspero la cifra de asimetría haciendo algo así como pub_his <- c(rep(10,16),rep(15,18),rep(20,27)...) Si se toma el punto medio de cada barra y se lee la frecuencia en el gráfico, se tendrán los datos y se podrá utilizar la función de asimetría.

5voto

AdamSane Puntos 1825

En el caso de la varianza (y de hecho para el cuarto momento central), el enfoque de "tomar el centro de la bandeja" conlleva un sesgo.

Este sesgo puede corregirse, a través de lo que se conoce como La corrección de Sheppard Por ejemplo, véase aquí , que en el caso de la varianza restaría $\frac{1}{12}$ del cuadrado de la anchura de la bandeja de la estimación del segundo momento. Sin embargo, en el caso del tercer momento, no es necesario este ajuste.

Por otro lado, el tercer momento asimetría si se calcula directamente dividiendo el tercer momento binizado por la varianza binizada no ajustada a la potencia $\frac{3}{2}$ dará lugar a un denominador demasiado grande, por lo que la asimetría estará en promedio ligeramente subestimada.

Esto sugiere que la varianza binada se ajuste mediante la corrección de Sheppard antes de calcular la asimetría. Por lo tanto:

1) Calcular los momentos de las binadas (primera, segunda, tercera) según sea necesario (es decir, tomando cada observación en su centro de la binada y, si es posible, utilizando las fórmulas de datos ponderados/agrupados).

2) corregir la varianza por el sesgo de agrupación

3) calcular la asimetría dividiendo el tercer momento agrupado por el segundo momento agrupado corregido.

Sin embargo, es posible que quiera reflexionar sobre las circunstancias en las que se aplican las correcciones. Por ejemplo, puede ver el análisis de las correcciones en Kendall y Stuart, o tal vez consultar

M. G. Kendall (1938),
Las condiciones de validez de las correcciones de Sheppard
Revista de la Real Sociedad de Estadística ,
Vol. 101, nº 3, p592-605

Aun así, dividir un numerador insesgado por un denominador insesgado no conduce por sí mismo a una proporción insesgada, incluso cuando son independientes, por lo que si una proporción realmente insesgada es de interés, se necesitaría un análisis adicional - pero generalmente tampoco nos preocupamos por eso cuando tratamos con la asimetría de la muestra ordinaria].

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X