Manipulación de características para el modelo de clasificación

Question

Manipulación de características para el modelo de clasificación

Preguntado el 19 de Febrero, 2021: Cuando se hizo la pregunta
58 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Espero obtener algún consejo para tratar un modelo de clasificación.

Digamos que tengo tres etiquetas de resultado [bajo, medio, alto] y tres características [F1, F2, F3]. Para simplificar, digamos que las características son un recuento bruto dentro de un área fija. Un aumento de los valores nominales en cada característica puede predecir un resultado "alto" para un evento concreto.

La pregunta central es cuándo los factores pueden influir en las características. Digamos que el 5-10% de las veces el área fija no es adecuada. En concreto, toda la zona no está operativa, por lo que un recuento más bajo puede considerarse "alto" porque una parte más pequeña del espacio está activa.

Soy reacio a manipular las características cuando se producen estos casos. Pero si tuviera que considerar una característica separada, podría no influir en las reglas porque ocurre con poca frecuencia.

Si esto es confuso puedo añadir algún código ficticio.

Preguntado el 19 de Febrero, 2021 por JPA0888

Answer 1

1 Respuestas

Answer 2

1voto

Djib2011 Puntos 693

Creo que la mejor opción sería añadir una función separada que indica el porcentaje de la superficie total que es operativa. Si esto no está disponible, al menos añada un indicador (es decir, 0-1) que muestre si toda la zona está operativa o no.

De este modo, le das al modelo toda la información disponible. Internamente, el modelo puede manipular las características de la forma que considere oportuna, con el fin de lograr el mejor rendimiento.

Al manipular las características por su cuenta, esencialmente pondría sus propias suposiciones en los datos, que podrían no ser válidas en la práctica.

Respondido el 19 de Febrero, 2021 por Djib2011 (693 Puntos )

Manipulación de características para el modelo de clasificación

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Manipulación de características para el modelo de clasificación

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: