9 votos

¿Alternativas al uso del coeficiente de variación para resumir un conjunto de distribuciones de parámetro?

De fondo

Tengo un modelo con 17 parámetros, y actualmente utilizo el coeficiente de variación ($\text{CV}=\sigma/\mu$) para resumir el previo y posterior distribución de cada parámetro.

Todos los parámetros son > 0. También me gustaría resumir estos archivos pdf en una escala normalizada (en este caso la desviación estándar normalizada por la media) de modo que puedan ser comparados entre sí, y con otras estadísticas presentadas en similar parcelas adyacentes (la sensibilidad, la varianza explicada). Voy a incluir densidad de parcelas para cada parámetro por separado, pero me gustaría resumir aquí.

Sin embargo, la sensibilidad de la CV a $\mu$ causas de la siguiente confusión que, aunque fácilmente se explica en el texto, sería preferible evitar.

  1. la parte posterior de la CV de un parámetro es mayor que el anterior debido a que la media se ha reducido a más de la varianza (parámetro O en la figura).
  2. uno de los parámetros (N) en las unidades de temperatura. Tiene un 95% antes de la CI (8,12 Celsius $\simeq$ 281-285K); cuando presente los datos en unidades de grados Kelvin, que sólo está definida para valores positivos, el CV es <1%, si se presenta como C, el CV es cerca de un 40%. Para mí, parece que ninguno de estos CVs proporciona una representación intuitiva de la CI.

Pregunta

Hay mejores formas de presentar la información, ya sea como un CV o como otro dato?

Figura

Como un ejemplo, este es el tipo de trama que estoy planeando hasta el presente, con posterior CV en negro y antes de CV en gris. Para la escala, el CV de un parámetro O es la 1.6.

alt text

6voto

Berek Bryan Puntos 349

A mí me parece que la CV es inapropiado aquí. Creo que puede ser mejor que separa el cambio en la ubicación de los cambios en la dispersión. Además, las distribuciones que usted menciona en su comentario a la pregunta, para la mayoría de los valores de los parámetros, sesgada (positiva, excepto para la distribución beta). Que me hace la pregunta de si la desviación estándar es la mejor opción para una medida de la dispersión; tal vez el rango intercuartil (IQR) podría ser mejor, o, posiblemente, la mediana de la desviación absoluta? Asimismo, en lugar de la media, yo podría considerar la mediana o la moda como medida de ubicación. La elección puede en la práctica ser determinado por la facilidad de cálculo, así como el campo de aplicación, los detalles de la modelo...

Digamos que usted elija para utilizar el IQR y el modo. Se podría resumir el cambio en la dispersión a través de la relación de posterior a anterior IQRs, probablemente graficada en una escala como la que suelen ser adecuados para las proporciones. Se podría resumir el cambio en la ubicación mediante el cociente de la diferencia entre la parte posterior y antes de modos a la previa IQR, o a la parte posterior IQR, o tal vez a la media geométrica de la parte posterior y antes de IQRs.

Estas son sólo algunas ideas que vinieron a la mente. Yo no puede reclamar ningún fuertes fundamentos para ellos, o incluso cualquier gran apego personal a ellos.

6voto

Akira Puntos 1061

Algunas de las alternativas, que tienen el mismo "sabor" como CV son:

  1. El coeficiente de L-variación, ver por ejemplo, Viglione. La segunda muestra L-momento en que toma el lugar de la desviación estándar de la muestra.
  2. El $\gamma$-Winsorized desviación estándar dividida por la $\gamma$-media limitada. Usted probablemente quiera dividir esto por $1 - 2\gamma$ para obtener una constante de escala a través de los diferentes valores de $\gamma$. Yo intentaría $\gamma = 0.2$.
  3. La raíz cuadrada del número de muestras veces el McKean-Schrader, la estimación del error estándar de la media, dividido por la mediana de la muestra.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X