1 votos

Predicción de n variables de clase

Tengo un dato histórico que tiene variables discretas. Digamos que tengo puntos de datos con etiquetas de clase

1, 2, 3, 4, and 5

Para un determinado problema de clasificación, puedo utilizar los datos de entrenamiento y luego obtener el modelo entrenado. Utilizando el modelo entrenado, puedo clasificar las etiquetas. Sin embargo, también me interesa la predicción de las etiquetas de clase.

Mi exigencia es que para un determinado $N$ puntos, digamos 5 puntos de datos, quiero saber cuál es la probabilidad de que la etiqueta de clase 5 sea más probable o menos probable de 0 a 1. ¿Puede alguien darme alguna idea sobre esto? Por ejemplo mi salida será una probabilidad de predicción para 5 instancias, siendo:

0, 0.1, 0.2, 0.3, 0.5.

Esto significa que el primer punto de datos tiene una probabilidad nula de que se produzca la etiqueta de clase 5. El 5º punto de datos tiene la mayor probabilidad de ocurrir alrededor del 50%. ¿Puede alguien darme una idea de cómo resolver este problema?

1voto

trish Puntos 31

En primer lugar, permítanme reformular el problema para asegurarme de que lo entiendo: tienes 5 puntos, pero no quieres clasificar los puntos, quieres una clasificación probabilidades .

Si ese es el caso, eso es lo que regresión multinomial (Wikipedia). Se trata en varios libros de texto; yo aprendí de Análisis de datos categóricos (enlace de Amazon a 3e) de Agresti, pero puede que no sea el mejor libro para el autoaprendizaje.

También puede utilizar un red neuronal (entrada del blog de Brian Dolhansky) que produce las probabilidades de pertenencia a una clase. Interesante cobertura del tema aquí (Ou y Murphey, 2007, Multi-class pattern classification using neural networks. Reconocimiento de patrones 40, 4-18).

0voto

ezequias Puntos 9

No estoy seguro de entender lo que está preguntando... Puede determinar la probabilidad de obtener la etiqueta de clase 5 entre 0 y 1 simplemente sumando la probabilidad de obtener 5 a 0 y la probabilidad de obtener 5 a 1 (p(0) + p(1) = 0 + .1 = .1)

Solución: Dado que la probabilidad de obtener la clase 5 entre 2 y 4 sería--> p(2) + p(3) + p(4) = .2 + .3 + .5 = .9 y la probabilidad de 5 entre 0 y 1 = p(0) + p(1) = 0 + .1 = .1

.9 > .1 Por lo tanto, la etiqueta de clase 5 tiene menos probabilidades de estar entre 0 y 1.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X