1 votos

Conjuntos de datos de clasificación con características categóricas y muchas clases

Como se indica en el título, me gustaría encontrar algunos conjuntos de datos de clasificación con $c \ge 5$ clases y una característica categórica o más. Incluso está bien si hay algunas características continuas, pero me gustaría al menos una categórica.

Tengo algunos conjuntos de datos genéticos donde las características toman valores en $\{ G, T, A, C\}$ pero lamentablemente la clase es binaria.

Tengo un método que debería mejorar el rendimiento de la precisión en esos conjuntos de datos. He utilizado algunos conjuntos de datos de la UCI, pero necesito más de ellos para mostrar un $p$ -valor que constata la mejora de las prestaciones.

2voto

Momo Puntos 5125

Consulta el repositorio de ML de la UCI http://archive.ics.uci.edu/ml/

Tiene más de 150 conjuntos de datos para diversas tareas de clasificación y sirve como una colección de conjuntos de datos bien aceptada para comparar nuevos métodos. Seguro que encontrará un conjunto de datos de respuesta multiclase con predictores categóricos.

Edit: Estoy seguro de que lo sabes, pero déjame mencionar que si tienes predictores con 5 o más clases nada prohíbe tomar un predictor como objetivo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X