6 votos

¿Por qué el efecto fijo p-valor en un modelo mixto ley unintuitively?

Tengo un problema con el cálculo de la significación de un efecto fijo en simple anidada diseño de experimento. Supongamos que tenemos un simple conjunto de datos:

individual  class   ind_mean    value   replicate
1   A   -0.37651119 -1.23495005 1
1   A   -0.37651119 1.24107015  2
1   A   -0.37651119 -0.41977074 3
1   A   -0.37651119 -1.09239410 4
2   A   0.01519211  0.15858308  1
2   A   0.01519211  0.69513257  2
2   A   0.01519211  0.05390856  3
2   A   0.01519211  -0.84685576 4
3   A   -0.19937009 0.49203770  1
3   A   -0.19937009 0.06218100  2
3   A   -0.19937009 -1.12546256 3
3   A   -0.19937009 -0.22623652 4
4   A   0.62853718  1.63792462  1
4   A   0.62853718  1.26212834  2
4   A   0.62853718  -0.52029892 3
4   A   0.62853718  0.13439466  4
5   B   2.38620939  2.67706019  1
5   B   2.38620939  1.71849546  2
5   B   2.38620939  2.31713740  3
5   B   2.38620939  2.83214451  4
6   B   0.91834030  -0.13221319 1
6   B   0.91834030  2.41841628  2
6   B   0.91834030  0.25367274  3
6   B   0.91834030  1.13348538  4
7   B   2.12694664  2.22003887  1
7   B   2.12694664  1.31492118  2
7   B   2.12694664  2.53495794  3
7   B   2.12694664  2.43786856  4
8   B   1.52867659  0.65959322  1
8   B   1.52867659  1.23188018  2
8   B   1.52867659  1.58976692  3
8   B   1.52867659  2.63346604  4

Ahora si me encaja la lme modelo de este tipo de datos, me sale

> summary(lme(value ~ class, .~1|individual, data = d))
...
Random effects:
 Formula: . ~ 1 | individual
        (Intercept)  Residual
StdDev:   0.3643563 0.8430941

Fixed effects: value ~ class 
               Value Std.Error DF  t-value p-value
(Intercept) 0.016962 0.2785935 24 0.060884  0.9520
classB      1.723081 0.3939908  6 4.373405  0.0047
...

Todo parece estar bien. Sin embargo, tengo exactamente el mismo fija las estimaciones de los parámetros, estadísticas y valores de p si me gustaría entrar en el modelo en la columna ind_mean que en lugar de la original de los valores promedios para cada individuo.

> summary(lme(ind_mean ~ class, .~1|individual, data = d))
...
Random effects:
 Formula: . ~ 1 | individual
        (Intercept)     Residual
StdDev:   0.5571871 1.854137e-16

Fixed effects: ind_mean ~ class 
               Value Std.Error DF  t-value p-value
(Intercept) 0.016962 0.2785935 24 0.060884  0.9520
classB      1.723081 0.3939908  6 4.373405  0.0047
...

En realidad este p-valor coincide con el ordinario de t-test, p-valor, donde yo iba a ejecutar la comparación de los promedios de los individuos. Por supuesto, esto tiene sentido, ya que las observaciones adicionales en este caso no agregar ninguna información. Sin embargo, en el caso del modelo original de las observaciones adicionales de hacer agregar información. De hecho, los datos generados sin ninguna influencia individual en todos, por lo que la correcta estadísticas sería.

> summary(lm(value ~ class, data = d))
...
Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.01696    0.22597   0.075    0.941    
classB       1.72308    0.31957   5.392  7.7e-06 ***
...

Mi estadística de la intuición sugiere que el p-valor del primer modelo debería estar en algún lugar entre los de segundo y tercer modelo, no es exactamente el mismo que en el segundo modelo. Es mi intuición mal? Estoy utilizando el método de una manera equivocada? Hay algunos métodos que me daría más adecuada los valores de p?

6voto

patfla Puntos 1

El modelo corresponde a

$$Y_{ijk}=\beta_0+\beta_i+u_{ij}+e_{ijk}$$

Utilizando las propiedades de los errores, $e_{ijk}$, El modelo correspondiente para los medios está dada como:

$$\overline{Y}_{ij}=\beta_0+\beta_i+u_{ij}+\overline{e}_{ij}$$

donde la varianza de $\overline{e}_{ij}$ ahora $\frac{\sigma^2_e}{n_{ij}}$ donde $n_{ij}=4$ en el conjunto de datos (es decir, "equilibrado"). Ahora esto muestra que el individuo medio son suficientes para las betas, dada la variación de parámetros. Esta es la razón por la que no la importa. Que sucede con cualquier múltiplo de distribución que no son únicos predictores.

Tenga en cuenta que los componentes de varianza se $0.55=\sqrt{\sigma^2_u+\frac{\sigma^2_e}{4}}$, que es la varianza de $u_{ij}+\overline{e}_{ij}$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X