Recall alto - Precisión baja para un conjunto de datos desequilibrado

Question

Recall alto - Precisión baja para un conjunto de datos desequilibrado

Preguntado el 22 de Marzo, 2016: Cuando se hizo la pregunta
42332 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Actualmente me encuentro con algunos problemas al analizar un conjunto de datos de tweets con máquinas de vectores soporte. El problema es que tengo un conjunto de entrenamiento de clases binarias desequilibrado (5:2); que se espera que sea proporcional a la distribución real de clases. Al predecir obtengo una precisión baja (0,47) para la clase minoritaria en el conjunto de validación; la recuperación es de 0,88. Intenté utilizar varios métodos de sobremuestreo y submuestreo (realizados en el conjunto de entrenamiento) que no mejoraron la precisión, ya que el conjunto de validación también está desequilibrado para reflejar la distribución real de las clases. También implementé diferentes costes en la máquina de vectores soporte, lo que ayudó. Ahora parece que ya no puedo mejorar el rendimiento.

¿Alguien tiene algún consejo sobre lo que podría hacer para mejorar mi precisión sin perjudicar mi capacidad de recuperación? Además, ¿alguien tiene alguna idea de por qué obtengo muchos más falsos positivos que falsos negativos (los positivos son la clase minoritaria)?

Preguntado el 22 de Marzo, 2016 por Cerno

Answer 1

1 Respuestas

Answer 2

2voto

sami javed Puntos 1

Lo normal sería ponderar el error en función de la frecuencia de clase. Por ejemplo, si lo hicieras en Python con sklearn:

model = sklearn.svm.SVC(C=1.0, kernel='linear', class_weight='balanced')
model.fit(X, y)

Respondido el 22 de Marzo, 2016 por sami javed (1 Puntos )

Recall alto - Precisión baja para un conjunto de datos desequilibrado

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

Recall alto - Precisión baja para un conjunto de datos desequilibrado

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: