Al construir un modelo de regresión logística para predecir si un producto cumple la norma, los datos tienen el siguiente aspecto.
Un lote de producción contiene diferentes productos.
Siempre hay algunos lotes de producción que no cumplen la norma. Por otro lado, siempre hay lotes que cumplen también.
Para los lotes de producción que siempre (todos los productos del lote, como el 113144) no cumplen la norma, y los lotes que siempre (todos los productos del lote, como el 345118) cumplen la norma, ¿sería mejor excluirlos en la construcción del modelo?
Gracias.