11 votos

"t valor" asociado con nlme/lme4

Entiendo que el problema de la determinación de los grados de libertad de multi-nivel de los modelos; por lo tanto, la decisión de Doug Bates et al. no informe de los valores de p como parte del paquete lme4 en R. por No mencionar la gran cantidad de problemas y, por ende, se centran en los valores de p, en general.

Sin embargo, me gustaría aclarar la naturaleza de la "t valor", informó en el resumen de la salida de un modelo multinivel en nlme o lme4.

No es el caso de que se reportó el valor de t en nlme/lme4 a partir de un conjunto de datos que comprenden datos correlacionados en realidad no es del t-distribución? (independientemente de que sabemos que los grados de libertad o no).

No es el "valor de t" en lme4 potencialmente engañosa.

16voto

Dipstick Puntos 4869

Básicamente $t$ es sólo $\beta/\mathrm{SE}(\beta)$ donde $\beta$ es de regresión parámetro. No hay nada engañoso en este valor si se consideran como esta relación, o como "uniforme" de los parámetros. Si usted mira Bates original de los argumentos en contra de $p$-valores en lme4 escribe principalmente sobre los grados de libertad que son problemáticos en lugar de la $t$ $F$ valores propios (véase también r-sig-mixto-modelos de preguntas frecuentes). Aviso que los diferentes software estadístico puede tener diferentes convención de nomenclatura, por ejemplo, como SPSS llamadas parámetros como $B$'s y estandarizado parámetros como $\beta$'s -- lme4 sigue la lm convenio de llamarlos Estimate y t value.

Pinheiro y Bates describir el uso de $p$-valores en "Modelos de Efectos Mixtos en S y S-PLUS", por lo que es difícil buscar argumentos en contra de ellos en este libro. Las proporciones también son discutidos por Bates en "lme4: Mixto-modelado de efectos de con R" en comparación a $t$ $F$ valores para los efectos fijos de los modelos, por ejemplo (p. 70):

En un modelo de efectos fijos el perfil de huellas en la escala original siempre va a ser líneas rectas. Para modelos mixtos estas huellas puede no ser lineal, como vemos aquí, contradiciendo el creencia generalizada de que las inferencias para el de efectos fijos los parámetros en los lineales de los modelos mixtos, basados en $T$ o $F$ distribuciones convenientemente ajustado grados de libertad, será completamente exacto. El real los patrones de desviación, los contornos son más complejo que eso.

lo que los hace de alguna manera similar, aunque no exactamente adecuado como esperamos que sea adecuado para la prueba de hipótesis.

Observe también que otros autores no siempre considerar el df problema a ser problemático, por ejemplo, Gałecki y Burzykowski en "Modelos de Efectos Mixtos Lineal El uso de R" suponemos $n-p$ grados de libertad y el tratamiento de su distribución es aproximadamente de $t$, por ejemplo, (p. 84):

La nula distribución de la $t$-estadístico de prueba es el $t$-distribución con $n − p$ grados de libertad.

y (p. 140):

Los intervalos de confianza para los componentes individuales del vector de parámetros $\beta$ puede ser construido sobre la base de una $t$-distribución utilizada como un aproximado de la distribución de la estadística de prueba

Así que parece que la principal razón es que mientras que $p$-valores puede ser engañoso porque claro nula distribución, $t$ valores todavía puede ser útil, al menos estandarizados de los parámetros. También se pueden utilizar para la prueba de hipótesis, pero usted necesita hacer algunas hipótesis acerca de su distribución y comprobar analizando el perfil de las parcelas. Lo Bates parece estar diciendo es que los utilice a su propio riesgo.

6voto

Jake Westfall Puntos 3777

Correcto, el de la estadística de Wald (reportado como una "t estadística" lme4) es, en general, en el mejor de sólo aproximadamente el t-distribuido por lineal de los modelos mixtos (LMMs). Es sólo exactamente t-distribuidos en ciertos casos muy especiales, por ejemplo, el modelo mixto de ANOVA con anidada factores aleatorios y equilibrada de datos.

Para los modelos mixtos lineales generalizados (GLMMs) con un no-respuesta normal, la distribución de la Wald estadística podría incluso no ser muy t como en todo. Por ejemplo, ver este hilo en la regresión logística, donde se muestra que las colas de la distribución de muestreo tienden a ser más delgado de lo normal en lugar de la más gruesa de lo normal. (Que el hilo no se centra en los modelos mixtos, pero el mismo problema surge allí.)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X