Redes neuronales - Estrategias para problemas con alta tasa de error de Bayes

Question

Redes neuronales - Estrategias para problemas con alta tasa de error de Bayes

Preguntado el 21 de Mayo, 2018: Cuando se hizo la pregunta
346 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Estoy construyendo una red neuronal para un problema de clasificación binaria en el que el error de Bayes (la tasa de error más baja posible) es probablemente cercano al 50%.

Lo que facilita la tarea es que no necesito hacer una predicción para cada observación de la muestra de prueba. Sólo quiero hacer una predicción para las observaciones en las que el modelo tiene una confianza bastante alta. Sin embargo, es mejor que el porcentaje de predicciones sea alto que bajo.

Hasta ahora, he utilizado una red neuronal estándar (feed-forward, pérdida de entropía cruzada, regularización L2 y activación sigmoidea en el nodo final). En la muestra de prueba, sólo tengo en cuenta las observaciones para las que el valor del nodo final $(\hat{Y}_i)$ está fuera de un intervalo de confianza bajo: $$\text{predicted class}_i = \begin{cases} 1 &\text{ if } \hat{Y}_i > 0.5 + a \\ 0 &\text{ if } \hat{Y}_i < 0.5 - a \\ \text{NA} &\text{else} \end{cases} \\ \text{where } a\in [0, 0.5] \text{ indicates the level of confidence required}$$

Para ajustar los hiperparámetros (incluyendo $a$ ), he diseñado una métrica que depende positivamente de:

Precisión de la muestra de prueba (sólo se cuentan las predicciones diferentes de NA)
Porcentaje de predicciones que difieren de NA.

Todavía no estoy satisfecho con el rendimiento obtenido con este enfoque, y estoy seguro de que hay formas más inteligentes de enfocar esto, por ejemplo, una función de pérdida personalizada. Consejos, enlaces a artículos, o incluso palabras clave de búsqueda relacionadas son bienvenidos.

Preguntado el 21 de Mayo, 2018 por Pierre Cattin

Answer 1

1 Respuestas

Answer 2

1voto

Daniel Daranas Puntos 15123

Puede que encuentres pérdida focal interesante. Se trata de una pérdida de entropía cruzada estándar remodelada que pondera a la baja la pérdida asignada a los ejemplos bien clasificados. Motiva a un clasificador a mostrar más confianza donde sea apropiado en lugar de temer sólo una enorme penalización por clasificación errónea y esconderse detrás de la tasa base.

También es posible que el elevado error de Bayes impida una buena aprendizaje de funciones útiles . Idear una tarea de juguete como paso intermedio podría ayudar.

Tengo curiosidad por saber si has hecho más progresos.

Respondido el 20 de Febrero, 2019 por Daniel Daranas (15123 Puntos )

Redes neuronales - Estrategias para problemas con alta tasa de error de Bayes

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Redes neuronales - Estrategias para problemas con alta tasa de error de Bayes

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: