En los libros de texto de introducción a la estadística, la moda suele describirse como la menos susceptible a la asimetría, seguida de la mediana, que a su vez es seguida por la media. La diferencia entre la mediana y la media me resulta bastante sencilla, pero no tengo muy claro lo de la moda. Parece que en las distribuciones discretas, es posible que la mediana y la moda sean la misma.
Por ejemplo, si tengo un conjunto de datos como el que se muestra a continuación:
#R code
median(rep(1:8, c(rep(1,3), rep(2, 2), 7, 1, 1)))
[1] 1 2 3 4 4 5 5 6 6 6 6 6 6 6 7 8
hist(rep(1:8, c(rep(1,3), rep(2, 2), 7, 1, 1)),
breaks=seq(0.5, 8, length=8), freq=FALSE, main="", xlab="values")
Aquí, la media y la mediana son
mean(rep(1:8, c(rep(1,3), rep(2, 2), 7, 1, 1))); median(rep(1:8, c(rep(1,3), rep(2, 2), 7, 1, 1)))
[1] 5.0625
[1] 6
La moda es 6. Así que en este caso, la mediana y la moda son idénticas. ¿Puede alguien explicar esto? Gracias.
0 votos
Si se tiene una distribución discreta, la moda es esencialmente el valor único que tiene la mayor probabilidad de ocurrir. La mediana, en cambio, es el valor que tiene la misma probabilidad de estar por encima o por debajo.