1 votos

Residuales en la regresión binomial negativa con inflación cero

¿Qué significan los residuos en el contexto de la regresión binomial negativa cero-inflada?

Estoy aprendiendo la regresión binomial negativa cero-inflada. Los datos proceden de un sistema educativo estatal e incluyen variables sobre el número de estudiantes inmigrantes identificados por cada escuela (que está inflado a cero), así como variables que reflejan una serie de características sociodemográficas (por ejemplo, nivel de pobreza, raza)

Mis análisis tienen dos objetivos:

  1. ¿Puedo predecir la inflación cero y el número de alumnos inmigrantes identificados en cada escuela según las características sociodemográficas?
  2. ¿Puedo utilizar los residuos para identificar las escuelas que probablemente no identifican a los estudiantes inmigrantes?

Todavía tengo una comprensión suave/incompleta de la naturaleza de doble componente de la regresión ZINB, es decir, el modelo binomial / de inflación cero combinado con el modelo binomial negativo / de recuento. Cuando pido a r los residuos, obtengo un coeficiente residual para cada escuela.

¿Es el residuo del modelo binomial? ¿O es el residuo para el modelo de recuento? ¿Alguna combinación? ¿Estoy pensando mal?

1voto

chahedous Puntos 43

Un residuo generalmente mide la distancia entre los datos observados y lo que se espera, dado el modelo ajustado. La distancia puede medirse de varias maneras, por lo que existen diferentes definiciones de residuo.

En el caso de la regresión lineal, la forma más común es simplemente trazar la distancia entre la expectativa media y la observación. Esto tiene sentido porque la adecuación de los residuos se comprueba fácilmente de forma visual, ya que los supuestos de la regresión lineal implican residuos normales, simétricos y homogéneos con varianza constante.

Para otras distribuciones (discretas) (incluido el caso ZINB), una comprobación visual de los residuos brutos es menos útil, ya que la varianza y la forma de las distribuciones suelen cambiar con la media, además de que existe el problema de evaluar la distribución de los valores discretos.

Para este tipo de modelos, más adecuados que los residuos brutos son los residuos de Pearson y de desviación, que también pueden utilizarse para los modelos con inflación cero. Sin embargo, con una fuerte inflación cero, tampoco aparecerán homogéneos. El "estándar de oro", en mi opinión, son los residuos cuantílicos (simulados), que también se denominan valores p bayesianos en la estadística bayesiana. Vea un ejemplo con un Poisson bayesiano con inflación cero aquí . Creo que esto sería lo mejor para su regresión ZINB, aunque esto probablemente requeriría un poco de codificación a mano.

En cuanto a sus preguntas concretas:

  1. Supongo que lo que preguntas es si puedes hacer que la inflación cero dependa de un predictor. La respuesta es sí.

  2. Sí, se pueden mirar los residuos para comprobarlo, pero si se quiere ver un efecto de la escuela, sería mucho más sencillo simplemente incluir la escuela como efecto fijo o aleatorio y mirar las estimaciones.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X