Quizás también quieras leer sobre los índices de diversidad. Tal vez usted ha oído hablar de el índice de Gini, en el que se cuantifica la desigualdad de ingresos, o lo que los economistas conocen como Hirschman-Herfindahl índice para cuantificar la concentración del mercado (el concepto parece haber sido descubierta primero por Edward Simpson, y se llama el índice de Simpson en ecología). Un mayor índice de Herfindahl significa una mayor concentración de mercado, es decir, usted tiene una empresa con más de la cuota de mercado.
O, para aquellos de nosotros que están familiarizados con el análisis de clase latente, muchos de nosotros hemos oído hablar de (Shannon) la entropía, que utilizamos para describir lo bien separados son los latente clases.
Ejemplo para los individuos como unidad de observación
Te voy a dar un ejemplo del uso normalizado de la entropía de Shannon (nota: el enlace de conexión en el artículo en el American Psychological Association) porque estoy más familiarizado con ella. La entropía (no normalizada!) para cada unidad de análisis (por ejemplo, cada vendedor, o de cada área metropolitana, etc) está dado por la fórmula:
$E = -\sum^C_{i=1}p_i \ln p_i$
Anteriormente, $C$ índices el número de categorías de artículos (o latente de las clases, grupos raciales, etc). Suponga que $\ln 0 = 0$.
Imaginar a la Señora Chen, muy especializado vendedor, vende sólo un elemento de D, es decir,(0, 0, 0, 1). Su entropía es 0 en este cálculo.
Ahora, imagina la Señora Huang, que vende todos los elementos en la misma proporción, es decir,(0.25, 0.25, 0.25, 0.25). Su valor de la entropía es $-4 \times 0.25 \times \ln 0.25 = 1.3863\ $, es decir, ella tiene el máximo valor posible de la entropía, dado que disponemos de 4 tipos de artículos para vender. Usted podría querer normalizar la entropía dividiendo por el valor máximo posible de la entropía, que es $\ln C$. Aquí, $\ln C = \ln 4 = 1.3863$, por lo que la Señora Huang normalizada la entropía es 1.
Ejemplo de grupos de observaciones o muestras
En el análisis de clase latente, normalmente calcular la entropía normalizado sobre todas las observaciones,
$E = 1 + \frac{1}{N \ln C}\sum^N\sum^C_{i=1}p_i \ln p_i$
(Nota: esta es de la primera fórmula en el enlace de arriba, con la notación modificado para que sea consistente con el resto de la respuesta)
Así, la fórmula anterior debe decirle lo mucho que la totalidad de la fuerza de ventas está especializada en cada año. Recuerde, si todos los vendedores tienen la exacta 1950 proporción de las ventas, entonces usted tiene un valor de entropía, pero puede tener una situación en la que el 50% de la salesforce fue sólo con la venta de producto D, el 20% la venta de sólo Una, etc. Que todavía sería un bonito especializados de salesforce, y verás que en el valor de la entropía.
Como se ilustra en la Budescu y Budescu (primer enlace), los Simpson/índice de Herfindahl, que ellos llaman de varianza generalizada (GV), debe llevar a cabo de forma equivalente a la entropía. El cálculo es un poco más simple, pero debe ser bastante fácil de hacer. Si estás en Stata, instalar el entropyetc
paquete de SSC (Nick Cox, que contribuye aquí con frecuencia, es el autor). Hay que tener en R paquetes que hacer esto también, pero no puedo ser molestado en buscar uno en concreto.