¿Deberíamos equilibrar el conjunto de datos si los datos están intrínsecamente desequilibrados?

Question

¿Deberíamos equilibrar el conjunto de datos si los datos están intrínsecamente desequilibrados?

Preguntado el 28 de Agosto, 2018: Cuando se hizo la pregunta
132 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

Esta pregunta ya tiene respuestas:

¿Cuándo los datos desequilibrados son realmente un problema en el aprendizaje automático? (4 respuestas )
¿Cuándo debo equilibrar las clases en un conjunto de datos de entrenamiento? (4 respuestas )

Supongamos que queremos predecir la tasa de cáncer(de regresión)/predecir si una persona tiene cáncer o no(clasificación). Los datos intrínsecamente tiene pocos pacientes con cáncer/baja tasa de cáncer, dicen 1/200. Y el conjunto de datos es buena y suficiente, dicen que más de 100.000.

Ahora la pregunta es: debo usar ciertos estrategia de muestreo para el balance de los datos antes de aplicar cualquier regresión/algoritmo de clasificación?

Desde mi punto de vista, la razón por la que necesitamos el balance de los datos es porque los datos que tenemos no sigue la distribución natural, es malo, como un 10/90 macho/hembra. Pero ahora, tenemos un buen de datos que sigue la distribución natural, debemos balance de los datos?

También me pregunto si las cosas son diferentes para la clasificación frente a la regresión. A pesar de la baja tasa de cáncer, ¿es correcto hacer la regresión sin muestreo?

Cualquier alto/nivel detallado ideas son de agradecer:)

Preguntado el 28 de Agosto, 2018 por G. Yu

Answer 1

1 Respuestas

Answer 2

0voto

Dominic.wig Puntos 204

Hay algunas respuestas muy buenas en este hilo.

¿Importa una muestra desequilibrada al hacer regresión logística?

Además, su configuración es una configuración clásica en la que tendría un alto costo si dijera que alguien no tiene cáncer, pero en realidad sí.

Respondido el 28 de Agosto, 2018 por Dominic.wig (204 Puntos )

¿Deberíamos equilibrar el conjunto de datos si los datos están intrínsecamente desequilibrados?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Deberíamos equilibrar el conjunto de datos si los datos están intrínsecamente desequilibrados?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: