Espero obtener algún consejo para tratar un modelo de clasificación.
Digamos que tengo tres etiquetas de resultado [bajo, medio, alto] y tres características [F1, F2, F3]. Para simplificar, digamos que las características son un recuento bruto dentro de un área fija. Un aumento de los valores nominales en cada característica puede predecir un resultado "alto" para un evento concreto.
La pregunta central es cuándo los factores pueden influir en las características. Digamos que el 5-10% de las veces el área fija no es adecuada. En concreto, toda la zona no está operativa, por lo que un recuento más bajo puede considerarse "alto" porque una parte más pequeña del espacio está activa.
Soy reacio a manipular las características cuando se producen estos casos. Pero si tuviera que considerar una característica separada, podría no influir en las reglas porque ocurre con poca frecuencia.
Si esto es confuso puedo añadir algún código ficticio.