¿Cuál es la diferencia entre decision_function, predict_proba y predict function para un problema de regresión logística?

Question

¿Cuál es la diferencia entre decision_function, predict_proba y predict function para un problema de regresión logística?

Preguntado el 21 de Febrero, 2018: Cuando se hizo la pregunta
25794 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

He estado revisando la documentación de sklearn pero no soy capaz de entender el propósito de estas funciones en el contexto de la regresión logística. Para decision_function dice que es la distancia entre el hiperplano y la instancia de prueba. ¿en qué es útil esta información en particular? y ¿cómo se relaciona esto con predict y predict-proba ¿Métodos?

Preguntado el 21 de Febrero, 2018 por Mr. Boy

Answer 1

1 Respuestas

Answer 2

53voto

eldering Puntos 3814

Recordemos que la forma funcional de la regresión logística es

$f(x) = \frac{1}{1 + e^{-(\beta_0 + \beta_1 x_1 + \cdots + \beta_k x_k)}}$

Esto es lo que devuelve predict_proba .

El término dentro del exponencial

$d(x) = \beta_0 + \beta_1 x_1 + \cdots + \beta_k x_k$

es lo que devuelve decision_function . El "hiperplano" al que se refiere la documentación es

$\beta_0 + \beta_1 x_1 + \cdots + \beta_k x_k = 0$

Esta terminología es un vestigio de las máquinas de vectores soporte, que estiman literalmente un hiperplano de separación. En el caso de la regresión logística, este hiperplano es una construcción un tanto artificial: es el plano de igual probabilidad, en el que el modelo ha determinado que ambas clases objetivo tienen la misma probabilidad.

En predict devuelve una decisión de clase utilizando la regla

$f(x) > 0.5$

A riesgo de caer en el error, el predict La función tiene muy pocos usos legítimos, y considero que utilizarla es un signo de error a la hora de revisar el trabajo de otros. Yo iría tan lejos como para llamarlo un error de diseño en el propio sklearn (el predict_proba debería haberse llamado a la función predict y predict debería haberse llamado predict_class si es que hay algo).

Respondido el 21 de Febrero, 2018 por eldering (3814 Puntos )

¿Cuál es la diferencia entre decision_function, predict_proba y predict function para un problema de regresión logística?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cuál es la diferencia entre decision_function, predict_proba y predict function para un problema de regresión logística?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: