14 votos

La varianza de la partición y de los cambios longitudinales en correlación con datos binarios

Yo soy el análisis de los datos sobre los 300.000 alumnos en 175 escuelas con una logística modelo lineal de efectos mixtos (random intercepta). Cada alumno se produce exactamente una vez y los datos que abarca 6 años.

  1. ¿Cómo puedo partición de la variación entre la escuela y el alumno de los niveles, de una manera similar a la VPC/ICC continua de los resultados ? He visto este artículo en el que propone 4 métodos, de los cuales a y B aparecen interesante para mí, pero me gustaría saber qué ventajas/inconvenientes podría estar en el uso de cualquiera de estos, y por supuesto si hay otras maneras de hacerlo.

  2. ¿Cómo puedo comparar el nivel de la escuela varianza residual de un año a otro (o cualquier otro período de tiempo) ? Hasta ahora he hecho esto por dividir los datos por año y ejecutar el modelo en contra de cada año de los datos, pero creo que esto es erróneo porque: i) no hay ninguna razón obvia por la que debo ser dividido por año; y ii) dado que los efectos fijos estimados son diferentes para cada año, la comparación de los efectos aleatorios, año a año, puede no tener sentido (esto es sólo mi intuición sería genial si alguien pudiera explicar esto de manera más formal, si es correcto).

NOTA: me re-escribió esta pregunta después de un debate en meta con whuber y Macro

15voto

Niall Puntos 51

Deje $y_{ij}, {\boldsymbol x}_{ij}$ denotar la respuesta y predictor de vectores (respectivamente) de los estudiantes $i$ en la escuela $j$.

(1) Para los datos binarios, creo que la manera estándar de hacer la varianza de la descomposición análoga a las que se han hecho para datos continuos es lo que los autores llaman el Método D (voy a comentar sobre los métodos a continuación) en el enlace de la concepción de los datos binarios como el resultado de una continua subyacente de la variable que se rige por un modelo lineal y descomponer la varianza en que latente escala. La razón es que los modelos logísticos (y otros GLMs) surge naturalmente de esta manera--

Para ver esto, definimos $y^{\star}_{ij}$ que se rige por un modelo lineal mixto:

$$ y^{\star}_{ij} = \alpha + {\boldsymbol x}_{ij} {\boldsymbol \beta} + \eta_j + \varepsilon_{ij} $$

donde $\alpha,\beta$ son los coeficientes de regresión, $\eta_j \sim N(0,\sigma^2)$ es el nivel de la escuela de efectos aleatorios y $\varepsilon_{ij}$ es la varianza residual plazo y tiene un estándar de la distribución logística. Ahora vamos a

$$ y_{ij} = \begin{cases} 1 & \text{if} \ \ \ y^{\star}_{ij}≥0\\ \\ 0 &\text{if} \ \ \ y^{\star}_{ij}<0 \end{casos} $$

deje $p_{ij} = P(y_{ij} = 1|{\boldsymbol x}_{ij},\eta_j)$ ahora, simplemente usando la logística CDF tenemos

$$p_{ij} = 1-P(y^{\star}_{ij}<0|{\boldsymbol x}_{ij},\eta_j) = \frac{ \exp \{-(\alpha + {\boldsymbol x}_{ij} {\boldsymbol \beta} + \eta_j) \} }{1+ \exp \{-(\alpha + {\boldsymbol x}_{ij} {\boldsymbol \beta} + \eta_j) \}}$$

ahora tomando el logit de transformación de ambos lados, tiene

$$ \log \left( \frac{ p_{ij} }{1 - p_{ij}} \right) = \alpha + {\boldsymbol x}_{ij} {\boldsymbol \beta} + \eta_j $$

que es exactamente la logística de efectos mixtos modelo. Así, el modelo logístico es equivalente a la variable latente del modelo especificado anteriormente. Una nota importante:

  • La escala de la $\varepsilon_{ij}$ no se identifica, ya que, si se escala hacia abajo, pero una constante $s$, sería simplemente cambiar los anteriores a

$$ \frac{ \exp \{-(\alpha + {\boldsymbol x}_{ij} {\boldsymbol \beta} + \eta_j)/s \} }{1+ \exp \{-(\alpha + {\boldsymbol x}_{ij} {\boldsymbol \beta} + \eta_j)/s \}}$$

$\ \ \ \ \ \ \ $, por tanto, los coeficientes y el de efectos aleatorios, simplemente tendría que ser ampliado por el
$\ \ \ \ \ \ $ en la cantidad correspondiente. Por eso,$s=1$, lo que implica ${\rm var}(\varepsilon_{ij}) = \pi^2/3$.

Ahora, si el uso de este modelo y, a continuación, la cantidad

$$ \frac{ \hat{\sigma}^{2}_{\eta} }{\hat{\sigma}^{2}_{\eta} + \pi^2/3 } $$

las estimaciones de la correlación intraclase de la subyacente variables latentes. Otra nota importante:

  • Si $\varepsilon_{ij}$ se especifica como, en su lugar, tener una distribución normal estándar, entonces usted tiene efectos mixtos modelo probit. En ese caso $$ \frac{ \hat{\sigma}^{2}_{\eta} }{\hat{\sigma}^{2}_{\eta} + 1 } $$ estimaciones de la tetracóricas correlación entre dos seleccionados al azar a los alumnos en la misma escuela, los cuales fueron mostrados por Pearson (alrededor de 1900, creo) para ser estadísticamente identificado cuando el subyacente continua de datos se distribuye normalmente (este trabajo mostró realmente estas correlaciones fueron identificados más allá del binario caso a las múltiples categoría de caso, donde estas correlaciones se denominan polychoric correlaciones). Por esta razón, puede ser preferible (y sería mi recommenation) para el uso de un modelo probit cuando el interés principal es la estimación de la (tetracóricas) de correlación intraclase de los datos binarios.

Con respecto a los otros métodos mencionados en el papel que enlaza:

  • (A) nunca he visto el método de linealización, pero uno de los inconvenientes que veo es que no hay ninguna indicación de la aproximación de error incurrido por este. Además, si vas a linealizar el modelo (a través de una potencialmente crudo aproximación), ¿por qué no usar un modelo lineal en el primer lugar (por ejemplo, la opción (C), que voy a llegar en un minuto)? También sería más complicado presente desde la CPI dependerá ${\boldsymbol x}_{ij}$.

  • (B) El método de simulación es intuitivamente atractivo para un estadístico, ya que sería dar un estimado de la varianza de la descomposición de la escala original de los datos, pero, dependiendo de la audiencia, puede (i) ser complicado para describir esta en sus "métodos" de la sección, y (ii) puede apagar de un revisor que estaba buscando algo más "estándar"

  • (C) Pretendiendo que el de datos es continuo, probablemente no es una gran idea, aunque no realizar terriblemente si la mayoría de las probabilidades no están demasiado cerca de 0 o 1. Pero, haciendo esto casi seguro que levantar una bandera roja a un revisor para que me quedaría lejos.

Ahora, finalmente,

(2) Si los efectos fijos son muy diferentes a través de los años, entonces tienes derecho a pensar que podría ser difícil para comparar el efecto aleatorio de varianzas a través de los años, ya que son potencialmente en diferentes escalas (esto está relacionado con la no-identidad de la ampliación de los temas mencionados más arriba).

Si desea mantener los efectos fijos a lo largo del tiempo (sin embargo, si usted los ve cambiando mucho a lo largo del tiempo, puede que no quiera hacer eso) pero mira el cambio en el efecto aleatorio de la varianza, se puede explorar este efecto mediante algún azar laderas y las variables ficticias. Por ejemplo, si usted quería ver si el ICCs fueron diferentes en los distintos años, pallars sobirà deje $I_k = 1$ si la observación fue realizada en el año $k$ y 0 en caso contrario y, a continuación, un modelo predictor lineal como

$$\alpha + {\boldsymbol x}_{ij} {\boldsymbol \beta} + \eta_{1j} I_1 + \eta_{2j} I_2 + \eta_{3j} I_3 + \eta_{4j} I_4 + \eta_{5j} I_5+ \eta_{6j} I_6$$

esto le dará un ICCs cada año, pero los mismos efectos fijos. Puede ser tentador utilizar un azar de la pendiente en el tiempo, haciendo que su predictor lineal

$$\alpha + {\boldsymbol x}_{ij} {\boldsymbol \beta} + \eta_{1} + \eta_{2} t $$

pero yo no recomiendo esto, ya que sólo permiten a sus asociaciones para aumentar a lo largo del tiempo, no disminuir.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X