8 votos

Mediana > Moda > Media > Rango

Mi pregunta es: ¿Existe un conjunto de datos que permita que la mediana sea mayor que la moda, que la moda sea mayor que la media y que la media sea mayor que el rango? Si es así, ¿existe un patrón o una característica específica de un conjunto de datos que permita esta situación (algún tipo de asimetría, quizás...)?

P.D. He corregido mi error tipográfico. Algunas de las respuestas ya dadas se refieren a la situación contraria para la que la mediana

10voto

Matt Puntos 588

Sí, no es difícil conseguir un conjunto así.

S = {0, 1, 2, 3, 4, 4, 1000}

Mediana = 3, Modo = 4, Media = 144,85, Rango = 1000

Los datos de este tipo tendrán un sesgo hacia la derecha, ya que su media es mayor que la mediana, lo que implica que, por término medio, los valores por encima de la mediana están más lejos que los valores por debajo.

8voto

AdamSane Puntos 1825

La pregunta ya ha sido respondida afirmativamente, pero abordemos esto desde el punto de vista de la construcción: ¿cómo hacemos un conjunto de datos que haga esto?

En primer lugar, hay que tener en cuenta que siempre podemos hacer que las tres medidas de localización sean mayores que el rango. Simplemente construya un conjunto de datos preliminar que tenga mediana > moda > media y calcule el rango. Ahora añada (rango-media) + $\epsilon$ (para algunos pequeños positivos $\epsilon$ ) a todos los valores de los datos para obtener el conjunto de datos final, con lo que las tres medidas de localización superarán el rango.

Así que hemos reducido el problema a encontrar un conjunto de datos en el que la mediana > la moda > la media.

Imaginemos que ya tenemos unos datos con una mediana y una moda adecuadas. Para hacer que la media sea menor que la mediana y la moda, basta con colocar un único valor lo suficientemente por debajo del grueso de los datos como para que la media baje; podemos colocar un segundo valor justo por encima del grueso de los datos para mantener la mediana donde estaba, sin cambiar la moda. Así que ahora podemos modificar un conjunto de datos existente que simplemente tiene mediana > moda y obtener uno que tenga la media donde queremos.

Así que vamos a crear uno con mediana > modo. Podemos hacerlo haciendo que un valor se repita (si es el único valor que aparece dos veces, es la moda de la muestra) y luego añadiendo otros valores suficientes para que la mediana sea mayor. Este es un ejemplo:

 21, 21, 22, 23, 24

La mediana es 22, pero la moda es 21.

Ahora vamos a añadir los dos puntos como se ha descrito anteriormente, de tal manera que la media sea 20 sin cambiar la mediana o la moda. Los puntos actuales suman 111, así que necesitamos dos puntos que sumen 140-111 = 29, y uno de ellos debe ser justo mayor que 24. Que sea 25. Entonces el punto más pequeño es 29-25 = 4.

Así que ahora nuestro conjunto de datos es:

4, 21, 21, 22, 23, 24, 25

Tiene la media 20, la moda 21 y la mediana 22.

Ahora vamos a arreglar la relación de estos con el rango. ¿Cuál es el rango? Es 25-4=21, que es actualmente mayor que la media. Simplemente tenemos que añadir algo a cada valor de los datos para que la media sea mayor que 21, lo que deja el rango inalterado. Basta con añadir 2. (Obsérvese que rango-media+1=2, por lo que podemos ver que hemos tomado $\epsilon=1$ )

Así que nuestro conjunto de datos final es

6, 23, 23, 24, 25, 26, 27

El rango sigue siendo 21, la media es ahora 22, la moda es 23, la mediana es 24

Así que este enfoque paso a paso es bastante fácil de usar. En resumen:

  1. Haz un pequeño conjunto de datos con mediana > moda repitiendo el valor más pequeño y teniendo todos los valores más grandes distintos (lo más fácil es usar valores ordenados). Tener 5 puntos es conveniente (ya que le permite especificar la mediana moviendo el valor medio), pero 4 es factible si es necesario.

  2. Obtenga una media por debajo de la mediana añadiendo dos puntos que no alteren la mediana o la moda (es decir, dos valores distintos/singulares no perturbarán la moda, y colocándolos a ambos lados de los datos anteriores se conservará la mediana; coloque el valor más grande justo por encima de todos los datos actuales y luego calcule el más pequeño para que la media global salga justo por debajo de la moda. Esto nos lleva a 7 puntos de datos.

  3. Calcula el rango. Añadir una constante (rango - media + $\epsilon$ ) a todos los valores de los datos, lo que garantiza que la media supera el rango. Este es el conjunto de datos final.


Comprobando esos cálculos en R:

x <- c(6, 23, 23, 24, 25, 26, 27)
data.frame(
     range=diff(range(x)),
     mean=mean(x),
     mode=max(as.numeric(names(table(x))[table(x)==max(table(x))])),
     median=median(x)
   )

  range mean mode median
1    21   22   23     24

(nótese que si de alguna manera generamos más de un modo, este cálculo trata de encontrar el mayor de ellos)

4voto

Hoogendijk Puntos 45

Independientemente de cuál sea el orden, la respuesta es sí. Los conjuntos de datos que son subconjuntos de distribuciones, cuyas colas izquierdas son más pesadas que sus colas derechas, tendrán frecuentemente la moda más pequeña que la mediana y la mediana más pequeña que la media y la media más pequeña que el rango. Una distribución beta con la moda mayor que 1/2 tendría esa propiedad. Si se quiere tener la moda en una posición determinada, se puede hacer una distribución mixta añadiendo un pequeño porcentaje de una distribución de desviación estándar estrecha (pequeña) pero alta, por ejemplo, Dirac $\delta$ , dondequiera que uno quiera poner ese modo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X