1 votos

Cómo encontrar una ganancia de información para valores numéricos

Tengo 4 clases y cuatro conjuntos de características extraídas de los enormes datos extraídos del sistema de adquisición de datos en tiempo real.

Features for each Class .

En la tabla anterior, hay 4 conjuntos de características para cada clase. (C1, C2, C3 y C4). Pero al calcular la ganancia de información, la ganancia de información es la misma para cada característica que para todos los atributos, ya que sólo hay un valor de cada atributo para cada clase.

¿Puede alguien ayudarme a calcular la ganancia de información para construir un árbol de decisión?

Gracias DDas

5voto

sjcorbett Puntos 35

Para utilizar la Ganancia de Información, tienes que utilizar una especie de función deslizante.

Sliding Splitting for Continuous Variables

En este ejemplo, utiliza GiniSplit, pero puedes aplicar Entropía / Ganancia de información. Esencialmente se ordenan los datos de forma ascendente. A continuación, para cada valor distinto, se crea una división (menor o igual que el valor frente a mayor que el valor) y calcular la InformationGain en esa división. Por último, elija la división que mejore más la ganancia de información.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X