20 votos

Diferencias entre regresión logística y perceptrones

Según entiendo, un perceptrón/red neuronal artificial de una sola capa con una función de activación sigmoidea logística es el mismo modelo que la regresión logística. Ambos modelos vienen dados por la ecuación:

$F(x) = \frac{1}{1-e^{-\beta X}}$

El algoritmo de aprendizaje del perceptrón es en línea y basado en el error, mientras que los parámetros para la regresión logística pueden aprenderse utilizando una variedad de algoritmos por lotes, incluyendo el descenso de gradiente y Limited-memory BFGS, o un algoritmo en línea, como el descenso de gradiente estocástico. ¿Hay alguna otra diferencia entre la regresión logística y un perceptrón sigmoideo? ¿Se espera que los resultados de un regresor logístico entrenado con descenso de gradiente estocástico sean similares al del perceptrón?

2 votos

Parece que esta pregunta es similar, y parece contener respuestas mejores :)

4voto

Digio Puntos 637

En realidad, hay una gran diferencia sustancial, que está relacionada con las diferencias técnicas que mencionaste. La regresión logística modela una función de la media de una distribución de Bernoulli como una ecuación lineal (siendo la media igual a la probabilidad p de un evento de Bernoulli). Al utilizar el enlace logit como una función de la media (p), el logaritmo de las probabilidades (log-probabilidades) se puede derivar analíticamente y se usa como respuesta de un modelo lineal generalizado. La estimación de parámetros en este GLM es entonces un proceso estadístico que produce valores de p y intervalos de confianza para los parámetros del modelo. Además de la predicción, esto te permite interpretar el modelo en inferencia causal. Esto es algo que no puedes lograr con un Perceptrón lineal.

El Perceptrón es un proceso de ingeniería inversa de la regresión logística: en lugar de tomar el logaritmo de y, toma la función logística inversa del producto interno wx, y no utiliza suposiciones probabilísticas ni para el modelo ni para su estimación de parámetros. El entrenamiento en línea te dará exactamente los mismos resultados para los pesos/parámetros del modelo, pero no podrás interpretarlos en inferencia causal debido a la falta de valores p, intervalos de confianza y, bueno, un modelo de probabilidad subyacente.

En resumen, la regresión logística es un GLM que puede realizar predicciones e inferencias, mientras que el Perceptrón lineal solo puede lograr predicciones (en cuyo caso funcionará igual que la regresión logística). La diferencia entre los dos es también la diferencia fundamental entre la modelización estadística y el aprendizaje automático.

3voto

b1ueskyz Puntos 1

Creo que una diferencia que estás pasando por alto es el hecho de que la regresión logística devuelve una probabilidad de clasificación basada en principios, mientras que los perceptrones clasifican con un límite rígido.

Esto se menciona en el artículo de Wiki sobre regresión logística multinomial.

0voto

gandalfos Puntos 21

Ya mencionaste las diferencias importantes. Por lo tanto, los resultados no deberían diferir tanto.

1 votos

Esto no proporciona una respuesta a la pregunta. Para hacer una crítica o solicitar aclaraciones al autor, deja un comentario debajo de su publicación.

1 votos

En realidad intenté responder a ambas preguntas: 1) "¿Existen otras diferencias entre la regresión logística y un perceptrón sigmoide?" y 2) "¿Deberíamos esperar que los resultados de un regresor logístico entrenado con descenso de gradiente estocástico sean similares al perceptrón?"

7 votos

Esa es una posición razonable, @MichaelDorner. ¿Te importaría expandir un poco tu respuesta para que sea más clara?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X