La pregunta ya ha sido respondida afirmativamente, pero abordemos esto desde el punto de vista de la construcción: ¿cómo hacemos un conjunto de datos que haga esto?
En primer lugar, hay que tener en cuenta que siempre podemos hacer que las tres medidas de localización sean mayores que el rango. Simplemente construya un conjunto de datos preliminar que tenga mediana > moda > media y calcule el rango. Ahora añada (rango-media) + $\epsilon$ (para algunos pequeños positivos $\epsilon$ ) a todos los valores de los datos para obtener el conjunto de datos final, con lo que las tres medidas de localización superarán el rango.
Así que hemos reducido el problema a encontrar un conjunto de datos en el que la mediana > la moda > la media.
Imaginemos que ya tenemos unos datos con una mediana y una moda adecuadas. Para hacer que la media sea menor que la mediana y la moda, basta con colocar un único valor lo suficientemente por debajo del grueso de los datos como para que la media baje; podemos colocar un segundo valor justo por encima del grueso de los datos para mantener la mediana donde estaba, sin cambiar la moda. Así que ahora podemos modificar un conjunto de datos existente que simplemente tiene mediana > moda y obtener uno que tenga la media donde queremos.
Así que vamos a crear uno con mediana > modo. Podemos hacerlo haciendo que un valor se repita (si es el único valor que aparece dos veces, es la moda de la muestra) y luego añadiendo otros valores suficientes para que la mediana sea mayor. Este es un ejemplo:
21, 21, 22, 23, 24
La mediana es 22, pero la moda es 21.
Ahora vamos a añadir los dos puntos como se ha descrito anteriormente, de tal manera que la media sea 20 sin cambiar la mediana o la moda. Los puntos actuales suman 111, así que necesitamos dos puntos que sumen 140-111 = 29, y uno de ellos debe ser justo mayor que 24. Que sea 25. Entonces el punto más pequeño es 29-25 = 4.
Así que ahora nuestro conjunto de datos es:
4, 21, 21, 22, 23, 24, 25
Tiene la media 20, la moda 21 y la mediana 22.
Ahora vamos a arreglar la relación de estos con el rango. ¿Cuál es el rango? Es 25-4=21, que es actualmente mayor que la media. Simplemente tenemos que añadir algo a cada valor de los datos para que la media sea mayor que 21, lo que deja el rango inalterado. Basta con añadir 2. (Obsérvese que rango-media+1=2, por lo que podemos ver que hemos tomado $\epsilon=1$ )
Así que nuestro conjunto de datos final es
6, 23, 23, 24, 25, 26, 27
El rango sigue siendo 21, la media es ahora 22, la moda es 23, la mediana es 24
Así que este enfoque paso a paso es bastante fácil de usar. En resumen:
-
Haz un pequeño conjunto de datos con mediana > moda repitiendo el valor más pequeño y teniendo todos los valores más grandes distintos (lo más fácil es usar valores ordenados). Tener 5 puntos es conveniente (ya que le permite especificar la mediana moviendo el valor medio), pero 4 es factible si es necesario.
-
Obtenga una media por debajo de la mediana añadiendo dos puntos que no alteren la mediana o la moda (es decir, dos valores distintos/singulares no perturbarán la moda, y colocándolos a ambos lados de los datos anteriores se conservará la mediana; coloque el valor más grande justo por encima de todos los datos actuales y luego calcule el más pequeño para que la media global salga justo por debajo de la moda. Esto nos lleva a 7 puntos de datos.
-
Calcula el rango. Añadir una constante (rango - media + $\epsilon$ ) a todos los valores de los datos, lo que garantiza que la media supera el rango. Este es el conjunto de datos final.
Comprobando esos cálculos en R:
x <- c(6, 23, 23, 24, 25, 26, 27)
data.frame(
range=diff(range(x)),
mean=mean(x),
mode=max(as.numeric(names(table(x))[table(x)==max(table(x))])),
median=median(x)
)
range mean mode median
1 21 22 23 24
(nótese que si de alguna manera generamos más de un modo, este cálculo trata de encontrar el mayor de ellos)