Supongamos que tengo algunos algunos variable de respuesta yij que se mide a partir del jth hermano en ith de la familia. Además, algunos datos sobre el comportamiento xij fueron recolectados en el mismo tiempo de cada sujeto. Estoy tratando de analizar la situación con la siguiente lineal modelo de efectos mixtos:
yij=α0+α1xij+δ1ixij+ϵij
donde α0 α1 son fijos intercepto y la pendiente, respectivamente, δ1i es el azar de la pendiente, y ϵij es el residual.
La hipótesis de los efectos aleatorios δ1i y residual ϵij (suponiendo que sólo hay dos hermanos dentro de cada familia)
δ1id∼N(0,τ2) (ϵi1,ϵi2)Td∼N((0,0)T,R),
donde τ2 es un desconocido de la varianza del parámetro y la varianza-covarianza de la estructura de R es un 2 x 2 matriz simétrica de la forma
(r21r212r212r22)
that models the correlation between the two siblings.
First, is this an appropriate model for such a sibling study?
Secondly, the data are a little bit complicated. Among the 50 families, close to 90% of them are dizygotic (DZ) twins. For the rest families,
1) two have only one sibling;
2) two have one DZ pair plus one sibling; and
3) two have one DZ pair plus two additional siblings.
I believe lme
in R package nlme
can easily handle 1) with missing or unbalanced situation. My trouble is, how to deal with 2) and 3)? One possibility I can think of is to break each of those four families in 2) and 3) into two so that each subfamily would have one or two siblings so the above model could be still applied to. Is this fine? Another option would be to simply throw away the data from the extra one or two siblings in 2) and 3), which seems to be a waste. Any better approaches?
Thirdly, it seems that lme
allows one to fix the r values in the residual variance-covariance matrix R, for example r212 = 0.5. ¿Tiene sentido imponer la correlación de la estructura, o debo simplemente una estimación basada en los datos?