Algunas técnicas de modelización predictiva están más diseñadas para manejar predictores continuos, mientras que otras son mejores para manejar variables categóricas o discretas. Por supuesto, existen técnicas para transformar un tipo en otro (discretización, variables ficticias, etc.). Sin embargo, ¿existen técnicas de modelización predictiva que estén diseñadas para manejar ambos tipos de entrada al mismo tiempo sin simplemente transformar el tipo de las características? En caso afirmativo, ¿estas técnicas de modelización tienden a funcionar mejor en los datos para los que se ajustan de forma más natural?
Lo más parecido que conozco sería que normalmente los árboles de decisión manejan bien los datos discretos y manejan los datos continuos sin requerir un al frente discretización. Sin embargo, esto no es exactamente lo que buscaba, ya que efectivamente las divisiones en características continuas son sólo una forma de discretización dinámica.
A modo de referencia, he aquí algunas preguntas relacionadas, no duplicadas:
- ¿Cómo deben implementarse las divisiones de los árboles de decisión cuando se predicen variables continuas?
- ¿Puedo utilizar la regresión múltiple cuando tengo predictores categóricos y continuos mezclados?
- ¿Tiene sentido tratar los datos categóricos como continuos?
- Análisis de datos de variables continuas y categóricas