2 votos

Predecir datos de resultados jerárquicos

Estoy tratando de predecir un resultado que es jerárquico. En concreto, los códigos de clasificación de la industria que se encuentran aquí: https://www.naics.com/search/

Se trata de números de seis dígitos en los que los dos primeros indican un sector amplio, como "Finanzas y Seguros". Dentro de esta categoría hay entre 10 y 50 categorías más específicas. Sin embargo, conocer la categoría de nivel superior elimina muchas posibilidades de las categorías posteriores.

¿Qué marco de modelización puede manejar este tipo de estructura altamente dependiente? Mi objetivo final es predecir la categoría más específica posible.

0voto

Ped Puntos 6

¿Cómo se define "la categoría más específica posible"? Una forma podría ser ejecutar varios clasificadores en diferentes niveles de granularidad.

El resultado de muchos clasificadores, como la regresión logística, es en realidad un número entre 0 y 1 que puede interpretarse como un grado de certeza con el que un punto de datos pertenece a una clase (según la regresión). Al tener clasificaciones de varios grados de granularidad para cada punto, se podría elegir la de mayor certeza (o el resultado más alto de la regresión logística/el clasificador que sea).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X