¿Qué significan los residuos en el contexto de la regresión binomial negativa cero-inflada?
Estoy aprendiendo la regresión binomial negativa cero-inflada. Los datos proceden de un sistema educativo estatal e incluyen variables sobre el número de estudiantes inmigrantes identificados por cada escuela (que está inflado a cero), así como variables que reflejan una serie de características sociodemográficas (por ejemplo, nivel de pobreza, raza)
Mis análisis tienen dos objetivos:
- ¿Puedo predecir la inflación cero y el número de alumnos inmigrantes identificados en cada escuela según las características sociodemográficas?
- ¿Puedo utilizar los residuos para identificar las escuelas que probablemente no identifican a los estudiantes inmigrantes?
Todavía tengo una comprensión suave/incompleta de la naturaleza de doble componente de la regresión ZINB, es decir, el modelo binomial / de inflación cero combinado con el modelo binomial negativo / de recuento. Cuando pido a r los residuos, obtengo un coeficiente residual para cada escuela.
¿Es el residuo del modelo binomial? ¿O es el residuo para el modelo de recuento? ¿Alguna combinación? ¿Estoy pensando mal?