7 votos

Calcular el índice de Gini

enter image description here

¿Cómo puedo calcular el índice de Gini utilizando el atributo de instancia como condición de la prueba de atributo?

I calcula el Gini, pero no tienen idea cómo hacerlo para este atributo de instancia.

$$\text{Gini for } a_1 = 0.345 $$ $$\text{Gini for } a_2 = 0.493 $$ $$\text{Gini for } a_3 = ?$$

Supongo que la respuesta a esto es que atributo de instancia no tiene información ganancia. Sin embargo, no puedo demostrarlo.

$$\text{Gini} = 1 - \sum_i p(i|t)^2$$

4voto

Nick Cox Puntos 22819

El índice de Gini aquí ($G$, por ejemplo) sólo calcula la diversidad o heterogeneidad (o la incertidumbre de si se quiere) de la suma de cuadrados de la categoría de probabilidades. Si cada valor está en la misma categoría, entonces la medida es $1 - 1^2 = 0$. Si cada valor de $n$ de los valores está en una categoría distinta, entonces la medida es $1 - n(1/n)^2 = 1 - 1/n$. El complemento es en algunos aspectos más fácil que pensar, por ejemplo, el recíproco de la complementan $1 / (1 - G)$ devuelve el "equivalente", es decir, el equivalente al número de igualmente común de las clases. Por lo tanto, los extremos para que son claramente de $1/1$$1/(1/n)$, es decir,$1$$n$.

Sus columnas $a_1$ $a_2$ tienen 4 T y 5 F y 5T y 4F, respectivamente, que llego a ser el mismo índice, es decir,$1 - (4/9)^2 - (5/9)^2 = .4938271605$; que un ridículo número de decimales, pero se sugiere que usted tiene un error grave para una columna y un error de redondeo para el otro. Con su $a_3$ el principio no cambia, como el índice ignora las etiquetas en las categorías: cualquiera que sea la métrica lo que significa que podría tener no es considerado. Por mi cálculo ha $1 - 5((1/9)^2) - 2 ((2/9)^2) = .8395061728$.

Otros nombres para esta medida, $G$ (o su complemento, o la inversa de la que) son Simpson, de Herfindahl y la velocidad de repetición. Gini parece haber llegó primero, pero sus aplicaciones a través de la ecología, la economía, la lingüística, y muchos otros campos de la legión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X