45 votos

¿Cuál es la diferencia entre la regresión logística y el perceptrón?

Estoy revisando la conferencia de Andrew Ng notas sobre el aprendizaje automático.

Los apuntes nos introducen en la regresión logística y luego en el perceptrón. Al describir el Perceptrón, los apuntes dicen que sólo hay que cambiar la definición de la función de umbral utilizada para la regresión logística. Una vez hecho esto, podemos utilizar el modelo Perceptron para la clasificación.

Así que mi pregunta es: si es necesario especificar esto y consideramos el Perceptron como una técnica de clasificación, entonces ¿qué es exactamente la regresión logística? ¿Se utiliza simplemente para obtener la probabilidad de que un punto de datos pertenezca a una de las clases?

-1voto

prosti Puntos 139

Andrew Ng utilizó el término "regresión logística" como modelo para resolver el problema de clasificación binaria.

Como ya han visto en el papel en realidad nunca dibuja el modelo en sí.

Permítanme añadir algunos detalles al cubo para que puedan encontrar el razonamiento sobre cómo creo que construyó las conferencias.

El modelo utilizado para la "regresión logística" es una percepción de un solo nivel con un número personalizado de entradas y una salida que va de 0 a 1.

En los años 90 la función de activación más apreciada era la función de activación sigmoidal, y existe una gran teoría matemática como respaldo.

Este es exactamente el modelo que utiliza Andrew Ng, ya que esa función va de 0 a 1.

También la derivada s'(x) = s(x)(1−s(x)) , donde s(x) es la función de activación sigmoidal.

Para la función de error utiliza L2, aunque en algunos trabajos puede utilizar alguna otra función para ello.

Así que para recapitular, al considerar la "regresión logística" sólo hay que tener en cuenta la percepción de un solo nivel con función de activación sigmoidal, número personalizado de entradas y una sola salida.


Sólo unas pocas notas: No hay nada malo con la función de activación sigmoidal, aunque para la aritmética de punto flotante, ReLU domina las capas ocultas hoy en día, pero en un futuro próximo posits (o algunas otras unidades aritméticas) puede poner la función de activación sigmoidal de nuevo en la mesa.

Personalmente, utilizaría un modelo más sencillo con la función ReLU para explicar el SLP (perceptrón de un solo nivel) ya que es más utilizado hoy en día.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X