42 votos

¿Cómo interpretar el coeficiente de variación?

Estoy tratando de entender el Coeficiente de Variación. Cuando intento aplicarlo a las siguientes dos muestras de datos no logro entender cómo interpretar los resultados.

Supongamos que la muestra 1 es ${0, 5, 7, 12, 11, 17}$ y la muestra 2 es ${10 ,15 ,17 ,22 ,21 ,27}$. Aquí la muestra 2 $=$ muestra 1 $+\ 10$ como puedes ver.

Ambas tienen la misma desviación estándar $\sigma_{2} = \sigma_{1}= 5.95539$ pero $\mu_{2}=18.67$ y $\mu_{1}=8.66667$.

Ahora el coeficiente de variación ${\sigma}/{\mu}$ será diferente. Para la muestra 2 será menor que para la muestra 1. Pero ¿cómo interpreto ese resultado? En términos de varianza ambas son iguales; solo sus medias son diferentes. Entonces, ¿cuál es el uso del coeficiente de variación aquí? Simplemente me está confundiendo, o tal vez no puedo interpretar los resultados.

0 votos

Si en lugar de agregar 10 se agrega 1000, el segundo conjunto de números diferirá mucho menos, en relación con la media, que el primer conjunto. El coeficiente de variación es una expresión de esto.

0 votos

53voto

Nick Cox Puntos 22819

En ejemplos como el tuyo, cuando los datos difieren solo de manera aditiva, es decir, cuando agregamos una constante $k$ a todo, como señalas la desviación estándar no cambia, la media cambia exactamente por esa constante, y el coeficiente de variación cambia de $\sigma / \mu$ a $\sigma / (\mu + k)$, lo cual no es ni interesante ni útil.

Es el cambio multiplicativo lo que resulta interesante y donde el coeficiente de variación tiene algún uso. Multiplicar todo por una constante $k$ implica que el coeficiente de variación sigue siendo $k \sigma/k \mu$, es decir, permanece igual que antes. El cambio de unidades de medida es un caso en cuestión, como en las respuestas de @Aksalal y @Macond.

Dado que el coeficiente de variación no tiene unidades, tampoco tiene dimensiones, ya que las unidades o dimensiones que posea la variable subyacente se eliminan mediante la división. Esto convierte al coeficiente de variación en una medida de variabilidad relativa, de modo que la variabilidad relativa de las longitudes se puede comparar con la de los pesos, y así sucesivamente. Un campo en el que el coeficiente de variación ha encontrado cierto uso descriptivo es en la morfometría del tamaño de los organismos en biología.

En principio y en la práctica, el coeficiente de variación solo está completamente definido y es útil para variables que son completamente positivas. Por lo tanto, en detalle, tu primer ejemplo con un valor de $0$ no es un ejemplo apropiado. Otra forma de ver esto es notar que si la media fuera cero, el coeficiente sería indefinido y si la media fuera negativa, el coeficiente sería negativo, asumiendo en este último caso que la desviación estándar es positiva. En cualquier caso, esto haría que la medida fuera inútil como medida de variabilidad relativa, o de hecho para cualquier otro propósito.

Una afirmación equivalente es que el coeficiente de variación es interesante y útil solo si los logaritmos están definidos de la manera habitual para todos los valores, y de hecho utilizar coeficientes de variación es equivalente a analizar la variabilidad de los logaritmos.

Aunque pueda parecer increíble para los lectores aquí, he visto publicaciones climatológicas y geográficas en las que los coeficientes de variación de las temperaturas en grados Celsius han desconcertado a científicos inexpertos que observan que los coeficientes pueden explotar a medida que las temperaturas medias se acercan a $0^\circ$C y se vuelven negativos para temperaturas medias por debajo del punto de congelación. Aún más extraño, he visto sugerencias de que el problema se resuelve utilizando Fahrenheit en su lugar. Por el contrario, el coeficiente de variación a menudo se menciona correctamente como una medida resumen definida si y solo si las escalas de medición califican como escala de razón. Como sucede, el coeficiente de variación no es especialmente útil incluso para temperaturas medidas en kelvin, pero por razones físicas más bien que matemáticas o estadísticas.

Al igual que en el caso de los ejemplos extraños de climatología, que dejo sin referenciar ya que los autores no merecen ni el crédito ni la vergüenza, el coeficiente de variación ha sido sobresaturado en algunos campos. A veces hay una tendencia a considerarlo como una especie de medida resumen mágica que encapsula tanto la media como la desviación estándar. Esto es un pensamiento primitivo, ya que incluso cuando la razón tiene sentido, no se puede recuperar la media y la desviación estándar a partir de ella.

En estadística, el coeficiente de variación es un parámetro bastante natural si la variación sigue una distribución gamma o lognormal, como se puede ver al observar la forma del coeficiente de variación para esas distribuciones.

Aunque el coeficiente de variación puede ser útil en algunos casos en los que se aplica, el paso más útil es trabajar en una escala logarítmica, ya sea mediante una transformación logarítmica o mediante el uso de una función de enlace logarítmico en un modelo lineal generalizado.

EDIT: Si todos los valores son negativos, entonces podemos considerar el signo como una convención que se puede ignorar. De manera equivalente, en ese caso, $\sigma / |\mu|$ es efectivamente un gemelo idéntico del coeficiente de variación.

EDIT 25 de mayo de 2020: Buena discusión detallada en Simpson, G.G., Roe, A. y Lewontin, R.C. 1960. Zoología Cuantitativa. Nueva York: Harcourt, Brace, pp. 89-94. Este texto está inevitablemente desactualizado en varios aspectos, pero incluye muchas explicaciones lúcidas y comentarios y críticas combativos.

Ver también Lewontin, R.C. 1966. Sobre la medición de la variabilidad relativa. Biología Sistemática 15: 141–142. https://doi.org/10.2307/sysbio/15.2.141

5 votos

+1 Esta publicación incluye los puntos clave sobre logaritmos y positividad que deberían ser parte de cualquier discusión sobre el tema. Las "historias de guerra" también hacen que sea una buena lectura.

0 votos

Pensé que no se podía calcular el CV si una variable es = 0?.

1 votos

@Jerf: Piénsalo bien. Si todos los valores son 0, entonces no hay variación y nada que calcular. No hay problema solo porque algunos valores individuales son 0, ya que eso por sí solo no descarta que la media sea 0. Sin embargo, siempre puedes encontrar ejemplos donde algunos valores no son cero pero la media es 0, por ejemplo, -1, 0, 1, en cuyo caso el coeficiente de variación es indeterminado. Pero en la práctica, el coeficiente de variación es más útil cuando todos los valores son positivos.

18voto

Bart Puntos 66

Imagina que dije "Hay 1,625,330 personas en este pueblo. Más o menos cinco." Estarías impresionado por mi precisa conocimiento demográfico.

Pero si dijera "Hay cinco personas en esta casa. Más o menos cinco." Pensarías que no tengo ni idea de cuántas personas hay en la casa.

Misma desviación estándar, CV's muy diferentes.

1 votos

Esta es una manera razonable de explicar qué es el CoV, pero no está claro cuánto relevante es para la pregunta del OP.

1 votos

OP pregunta: "En términos de varianza ambos son iguales; solo sus medias son diferentes. Entonces, ¿cuál es el uso del coeficiente de variación aquí?" Creo que mi ejemplo ilustra el uso del CV como una forma de interpretar la varianza.

1 votos

No te he dado un voto negativo. Las 2 preguntas explícitas del OP son: "¿cómo interpreto ese resultado?" y "¿cuál es el uso del coeficiente de variación aquí?". Tu explicación es buena, pero entender qué es el CoV es solo el primer paso para responder esas preguntas, no la totalidad de la respuesta a esas preguntas.

5voto

Aksakal Puntos 11351

Normalmente, se utiliza el coeficiente de variación para variables de diferentes unidades de medida o escalas muy diferentes. Puedes pensar en ello como una relación ruido/señal. Por ejemplo, puede que desees comparar la variabilidad del peso y la altura de los estudiantes; variabilidad del PIB de EE. UU. y Mónaco.

En tu caso, el coeficiente de variación puede que no tenga mucho sentido en absoluto, ya que los valores no son muy diferentes.

4voto

La muestra con valores más altos tiene menos variación en relación con su media, como sugiere la definición ($s / \bar{x}$). En realidad es bastante sencillo. El coeficiente de variación es útil al comparar la variación entre muestras (o poblaciones) de escalas diferentes. Imagina que estás trabajando con salarios entre países. Comparar la variación en salarios en EE.UU. y Japón es menos informativo si usas la varianza en lugar del coeficiente de variación como tu estadístico, porque 1 USD ~= 100 JPY y una diferencia de 1 unidad en salarios no significa lo mismo en ambas muestras. Bueno, en este ejemplo puedes convertir todo a USD y luego hacer los cálculos, pero no siempre es obvio cómo convertir entre diferentes escalas. Especialmente al comparar la variación en pesos corporales de diferentes especies, por ejemplo.

3voto

user62371 Puntos 11

En realidad, ambas estadísticas pueden ser engañosas si no conoces o entiendes tu hipótesis y experimento. Considera este ejemplo espeluznante... Caminar por dos edificios altos en una cuerda floja en comparación con caminar en una tabla. Digamos que la cuerda floja tiene un diámetro de 1 pulgada, mientras que la tabla mide 12 pulgadas de ancho. Se pidió a 5 personas que caminaran por la cuerda y a 5 que caminaran por la tabla. Encontramos los siguientes resultados:

La distancia promedio de cada paso desde el borde (o lado) de la cuerda (pulgadas): 0.5, 0.2, 0.3, 0.6, 0.1

La distancia promedio de cada paso desde el borde (o lado) de la tabla (pulgadas): 5.5, 5.2, 5.3, 5.6, 5.1

Así como en tu ejemplo, este ejemplo resultaría en desviaciones estándar iguales ya que los valores para la tabla son simplemente una diferencia de +5 con respecto a los de la cuerda floja. Sin embargo, si te dijera que la desviación estándar para cada experimento fue de 0.2074 podrías decir que los dos experimentos eran equivalentes. Sin embargo, si te dijera que el CV para el experimento de la cuerda floja fue casi del 61% en comparación con menos del 4% para la tabla, podrías inclinarte a preguntarme cuántas personas se cayeron de la cuerda.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X