Tengo un dato histórico que tiene variables discretas. Digamos que tengo puntos de datos con etiquetas de clase
1, 2, 3, 4, and 5
Para un determinado problema de clasificación, puedo utilizar los datos de entrenamiento y luego obtener el modelo entrenado. Utilizando el modelo entrenado, puedo clasificar las etiquetas. Sin embargo, también me interesa la predicción de las etiquetas de clase.
Mi exigencia es que para un determinado $N$ puntos, digamos 5 puntos de datos, quiero saber cuál es la probabilidad de que la etiqueta de clase 5 sea más probable o menos probable de 0 a 1. ¿Puede alguien darme alguna idea sobre esto? Por ejemplo mi salida será una probabilidad de predicción para 5 instancias, siendo:
0, 0.1, 0.2, 0.3, 0.5.
Esto significa que el primer punto de datos tiene una probabilidad nula de que se produzca la etiqueta de clase 5. El 5º punto de datos tiene la mayor probabilidad de ocurrir alrededor del 50%. ¿Puede alguien darme una idea de cómo resolver este problema?