5 votos

Problemática residual parcela de modelo mixto lineal

He montado el siguiente modelo lineal mixto con base en los resultados de un juego económico:

lmer(TotalScore~perOOgivenP+Game+(1|Subject),REML=T,data=mdl1table)->m1

TotalScore es un número entero.
perOOgivenP es una proporción entre el 0 y el 1 (la mayoría de los cuales son 0).
El juego es numérico y nos dice si es el 1 o el 2 ° juego jugado por el participante

El Q la trama se ve bien así que estoy seguro de que los residuos están normalmente distribuidos. El amueblada vs residuos de la trama no se ve tan bien. A mí me parece que los residuos son sesgadas. No estoy seguro de cuál Es la causa de esto o qué hacer al respecto?

Podría ser causado por la cantidad de 0 en perOOgivenP (32/46 puntos de datos). perOOgivenP es la proporción de veces que un determinado comportamiento se hizo. Alguien podría sugerir hacer este binario como en 0 o 1 (verdadero valor no es 0).

perOOgivenP es como sigue:

 [1] 0.500000 1.000000 0.333333 0.000000 0.000000 0.000000      NaN 0.166667 0.250000 0.800000
[11] 0.166667 0.000000 0.333333 0.000000 0.000000      NaN      NaN 0.000000 0.000000 0.000000
[21]      NaN 1.000000      NaN 0.000000      NaN 0.000000 0.000000      NaN      NaN      NaN
[31]      NaN 0.000000      NaN 0.000000 0.000000 0.000000      NaN      NaN      NaN 1.000000
[41]      NaN 0.000000 0.411765 0.000000 0.000000      NaN      NaN 0.000000 0.200000 0.000000
[51]      NaN 0.000000 0.333333 0.000000 0.250000      NaN 0.000000      NaN      NaN      NaN
[61] 0.000000      NaN 0.000000 0.000000      NaN 0.000000      NaN      NaN      NaN 0.000000
[71] 0.000000 0.000000 0.000000      NaN      NaN      NaN      NaN      NaN      NaN      NaN

Fitted vs. residuals plot

6voto

Ted Puntos 854

Por "parcial" que presumiblemente significa que hay una cierta estructura no-lineal de la izquierda en los residuos. No es obvio para mí que este es el caso aquí.

Antes de sacar conclusiones precipitadas - y ciertamente antes de la pérdida de la información por la transformación de variables en menos informativos estado - me gustaría ver a más gráficos de residuos. Una respuesta obvia sería darle un color diferente o la forma de los residuos en los que el sospechoso variable tiene un valor de cero y ver cómo esto impacta en los residuos.

1voto

Jefromi Puntos 168

Si perOOgivenP tiene demasiados ceros, que pueden causar que los coeficientes no NA. Puede ser un gran problema. Incluso si usted consigue el ajuste de los valores, no puede ser exacta. Usted necesita para mostrar más información acerca de esta variable.

Es difícil decir whenther esta residual de la parcela es sesgada o no. Una cosa que es evidente que usted puede hacer es correr lm(residuos~c(1:n)), donde n es la longitud o residuos. Los coeficientes de la conexión de la línea debe ser cercano a 0. También, le sugiero que utilice abline(h=0) para el residual de la parcela.

0voto

f1r3br4nd Puntos 762

Usted podría intentar trazar la estandarización de los residuos y a ver si muy pocos de ellos tienen un valor absoluto mayor que 3.

Pero el elefante en la habitación es, si perOOgivenP es una proporción, usted necesita para normalizar sus datos (punto en el que incluso más de la que se convertirá en observaciones ausentes). Lo ideal sería tener un gran número suficiente de ensayos para cada observación de que los ceros sería sustituido por pequeños números reales. Si eso no es práctico, tal vez usted podría tratar de regresión de Poisson o análisis de supervivencia con eventos recurrentes (puede utilizar Subject como una agrupación o la fragilidad plazo).

Pero, en cualquier caso, los datos, como se muestra violan los supuestos de normalidad.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X