1 votos

Si para excluir los datos de un solo valor para el modelo de predicción binomial, la regresión logística

Al construir un modelo de regresión logística para predecir si un producto cumple la norma, los datos tienen el siguiente aspecto.

enter image description here

Un lote de producción contiene diferentes productos.

Siempre hay algunos lotes de producción que no cumplen la norma. Por otro lado, siempre hay lotes que cumplen también.

Para los lotes de producción que siempre (todos los productos del lote, como el 113144) no cumplen la norma, y los lotes que siempre (todos los productos del lote, como el 345118) cumplen la norma, ¿sería mejor excluirlos en la construcción del modelo?

Gracias.

2voto

mdewey Puntos 579

Excluirlas parece una mala idea, ya que presumiblemente contienen información sobre las variables que le interesan. Lo que hay que tener en cuenta es la posibilidad de que su modelo sufra de separación, que se produce cuando para algún valor o valores de las covariables todas las unidades son cero o uno. Hay muchos posts en este sitio sobre la separación que puede examinar si ocurre. Sabrás que ocurre porque los coeficientes de tu regresión logística se irán al infinito (o al menos al infinito). Lo que hagas depende de tu pregunta científica.

¿Cómo tratar la separación perfecta en la regresión logística?

contiene muchos consejos valiosos, especialmente en la respuesta de scortchi

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X