Processing math: 100%

14 votos

-Mezcla-efectos lineales modelado con datos del estudio twin

Supongamos que tengo algunos algunos variable de respuesta yij que se mide a partir del jth hermano en ith de la familia. Además, algunos datos sobre el comportamiento xij fueron recolectados en el mismo tiempo de cada sujeto. Estoy tratando de analizar la situación con la siguiente lineal modelo de efectos mixtos:

yij=α0+α1xij+δ1ixij+ϵij

donde α0 α1 son fijos intercepto y la pendiente, respectivamente, δ1i es el azar de la pendiente, y ϵij es el residual.

La hipótesis de los efectos aleatorios δ1i y residual ϵij (suponiendo que sólo hay dos hermanos dentro de cada familia)

δ1idN(0,τ2) (ϵi1,ϵi2)TdN((0,0)T,R),

donde τ2 es un desconocido de la varianza del parámetro y la varianza-covarianza de la estructura de R es un 2 x 2 matriz simétrica de la forma

(r21r212r212r22)

that models the correlation between the two siblings.

First, is this an appropriate model for such a sibling study?

Secondly, the data are a little bit complicated. Among the 50 families, close to 90% of them are dizygotic (DZ) twins. For the rest families,

1) two have only one sibling;

2) two have one DZ pair plus one sibling; and

3) two have one DZ pair plus two additional siblings.

I believe lme in R package nlme can easily handle 1) with missing or unbalanced situation. My trouble is, how to deal with 2) and 3)? One possibility I can think of is to break each of those four families in 2) and 3) into two so that each subfamily would have one or two siblings so the above model could be still applied to. Is this fine? Another option would be to simply throw away the data from the extra one or two siblings in 2) and 3), which seems to be a waste. Any better approaches?

Thirdly, it seems that lme allows one to fix the r values in the residual variance-covariance matrix R, for example r212 = 0.5. ¿Tiene sentido imponer la correlación de la estructura, o debo simplemente una estimación basada en los datos?

11voto

Niall Puntos 51

Usted puede incluir los gemelos y de los no-gemelos en un modelo unificado mediante el uso de una variable ficticia y como aleatorio pistas en que la variable ficticia. Dado que todas las familias tienen más de un par de gemelos, este será relativamente sencillo:

Deje Aij=1 si hermano / a j familia i es un gemelo, y 0 en caso contrario. Estoy asumiendo que usted también quiere que el azar pendiente a diferir para los gemelos vs regulares hermanos - si no, no incluyen la ηi3 plazo en el modelo de abajo.

A continuación, ajuste el modelo:

yij=α0+α1xij+ηi0+ηi1Aij+ηi2xij+ηi3xijAij+εij

  • α0,α1 son efecto fijo, como en su specifiation

  • ηi0 es la "línea de base" hermano de efectos aleatorios y ηi1 es el adicional de efecto aleatorio que permite a los gemelos a ser más similar a la de los hermanos. Los tamaños de los correspondientes al azar efecto de las desviaciones de cuantificar cómo de similares hermanos son y cuánto más similares a los gemelos a la de los hermanos. Tenga en cuenta que ambos gemelos y de la no-twin correlaciones se caracterizan por este modelo - twin correlaciones se calculan mediante la suma de los efectos aleatorios adecuadamente (plug in Aij=1).

  • ηi2 ηi3 tienen funciones análogas, sólo actúan como el azar laderas de xij

  • εij son iid términos de error de la nota que he escrito de su modelo de forma ligeramente diferente en términos de azar intercepta más que correlaciona los errores residuales.

Puede adaptar el modelo de uso de la R paquete lme4. En el siguiente código de la variable dependiente es y, la variable ficticia es A, el predictor es x, el producto de la variable ficticia y el predictor es Ax y famID es el número identificador de la familia. Sus datos se supone que para ser almacenados en una estructura de datos D, con estas variables como columnas.

library(lme4) 
g <- lmer(y ~ x + (1+A+x+Ax|famID), data=D) 

El efecto aleatorio de las variables y los efectos fijos estimados pueden ser vistos por escribir summary(g). Tenga en cuenta que este modelo permite que los efectos aleatorios para ser libremente correlacionados unos con otros.

En muchos casos, puede tener más sentido (o ser más fácilmente interpretables) asumir independencia entre los efectos aleatorios (por ejemplo, esta suposición es a menudo descomponer genética vs ambiental correlación familiar), en el que caso de que hubiera lugar tipo

g <- lmer(y ~ x + (1|famID) + (A-1|famID) + (x-1|famID) +(Ax-1|famID), data=D) 

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X