4 votos

Inferir varias razones y proporciones binomiales con los datos que faltan

Tengo una serie de estudios descriptivos de las familias de la prueba de una condición genética. Para cada estudio, los datos siguientes se describen:

  • $n_p$, el número de probandos (la persona afectada es la primera persona en una familia para ser diagnosticado con la condición genética, así que esto es generalmente igual al número de familias)
  • $n_r$, el número de familiares identificados (este es el número total de personas identificadas a través de las familias menos el número de probandos)
  • $n_c$, el número de familiares dada la asesoría genética
  • $n_t$, el número de parientes dado pruebas genéticas

Los familiares deben ser identificados antes de que se puede dar el asesoramiento genético, y se les debe de dar la asesoría genética antes de que puedan ser dado pruebas genéticas.

Si asumo que $n_r \sim r \times n_p$, $n_c \sim p_c \times n_r$ y $n_t \sim p_t \times n_c$ ¿cómo puedo inferir $r$, $p_c$ y $p_t$ dado que algunos de los valores de $n_p$, $n_r$, $n_c$ y $n_t$ que faltan (no informado)?

Estoy feliz de trabajar en WinBUGS, Stata, R, y tal vez los demás!

Gracias

1voto

Cerin Puntos 197

Aquí está mi propia solución actual:

Deje $N_{p,i}$ ser la variable aleatoria que indica el número de sujetos en estudio $i$, y deje $N_{r,i},N_{c,i},N_{t,i}$, respectivamente, indican los números de los familiares, los aconsejado y los evaluados en el estudio de $i$.

Yo no especifica una distribución de $N_{p,i}$. Que modelo de $N_{r,i}$ como:

$N_{r,i} \mid N_{p,i} = n_{p,i} \sim Poisson(r \times n_{p,i})$

Esto quizás no sea el derecho de distribución a utilizar, por favor deje un comentario con cualquier otro sugerencias! Yo, a continuación, modelo $N_{c,i}$ como:

$N_{c,i} \mid N_{r,i} = n_{r,i} \sim Bin(p_c, n_{r,i})$

Si $N_{r,i}$ no está especificado, pero $N_{p,i}$ es,$N_{c,i} \mid N_{p,i} = n_{p,i} \sim Poisson(r \times p_c \times n_{p,i})$. Yo, a continuación, modelo $N_{t,i}$ como:

$N_{t,i} \mid N_{c,i} = n_{c,i} \sim Bin(p_t, n_{c,i})$

Si $N_{c,i}$ no está especificado, pero $N_{r,i}$ es,$N_{t,i} \mid N_{r,i} = n_{r,i} \sim Bin(p_c \times p_t, n_{r,i})$. Si no $N_{c,i}$ ni $N_{r,i}$ se especifican sino $N_{p,i}$ es,$N_{t,i} \mid N_{p,i} = n_{p,i} \sim Poisson(r \times p_c \times p_t \times n_{p,i})$.

Yo, a continuación, divida a los estudios de acuerdo a las variables que son observados y aplicar el correspondiente distribución marginal. Aquí está mi WinBUGS código:

model {
  # Where all four variables are observed
  for (i in 1:N_PRCT) {
    # N_{r,i} | N_{p,i} = n_{p,i} ~ Poisson(r * n_{p,i})
    lam[Q_PRCT[i]] <- r * N_p[Q_PRCT[i]]
    N_r[Q_PRCT[i]] ~ dpois(lam[Q_PRCT[i]])
    # N_{c,i} | N_{r,i} = n_{r,i} ~ Bin(p_c, n_{r,i})
    N_c[Q_PRCT[i]] ~ dbin(p_c, N_r[Q_PRCT[i]])
    # N_{t,i} | N_{c,i} = n_{c,i} ~ Bin(p_t, n_{c,i})
    N_t[Q_PRCT[i]] ~ dbin(p_t, N_c[Q_PRCT[i]])
  }

  # Where the number being counseled is not observed
  for (i in 1:N_PRT) {
    # N_{r,i} | N_{p,i} = n_{p,i} ~ Poisson(r * n_{p,i})
    lam[Q_PRT[i]] <- r * N_p[Q_PRT[i]]
    N_r[Q_PRT[i]] ~ dpois(lam[Q_PRT[i]])
    # N_{t,i} | N_{r,i} = n_{r,i} ~ Bin(p_c * p_t, n_{r,i})
    N_t[Q_PRT[i]] ~ dbin(p_cp_t, N_r[Q_PRT[i]])
  }

  # Where only the number of probands and the number of
  # relatives tested are observed
  for (i in 1:N_PT) {
    # N_{t,i} | N_{p,i} = n_{p,i} ~ Poisson(r * p_c * p_t * n_{p,i})
    lam[Q_PT[i]] <- rp_cp_t * N_p[Q_PT[i]]
    N_t[Q_PT[i]] ~ dpois(lam[Q_PT[i]])
  }

  # Where the number of probands is not observed
  for (i in 1:N_RCT) {
    # N_{c,i} | N_{r,i} = n_{r,i} ~ Bin(p_c, n_{r,i})
    N_c[Q_RCT[i]] ~ dbin(p_c, N_r[Q_RCT[i]])
    # N_{t,i} | N_{c,i} = n_{c,i} ~ Bin(p_t, n_{c,i})
    N_t[Q_RCT[i]] ~ dbin(p_t, N_c[Q_RCT[i]])
  }

  # Vague priors on r, p_c and p_t
  r ~ dgamma(1, 0.001)
  p_c ~ dbeta(1, 1)
  p_t ~ dbeta(1, 1)

  rp_c <- r * p_c
  rp_cp_t <- r * p_c * p_t
  p_cp_t <- p_c * p_t
}

# DATA
list(
  N_PRCT=2, Q_PRCT=c(6,8),
  N_PRT=9,  Q_PRT=c(1,2,3,7,12,13,14,15,16),
  N_PT=4,   Q_PT=c(5,9,10,11),
  N_RCT=1,  Q_RCT=c(4),
  N_p=c(537,    18,     84,     NA,
        10,     36,     1,      4,
        44,     111,    6,      39,
        32,     113,    147,    17),
  N_r=c(10283,  167,    2309,   286,
        NA,     446,    96,     208,
        NA,     NA,     NA,     643,
        620,    3104,   6195,   405),
  N_c=c(NA,     NA,     NA,     113,
        NA,     347,    NA,     92,
        NA,     NA,     NA,     NA,
        NA,     NA,     NA,     NA),
  N_t=c(2622,   68,     694,    112,
        21,     334,    39,     84,
        249,    1359,   156,    38,
        127,    525,    432,    157)
)

Próximos pasos para moverlo de un de efectos fijos meta-análisis de efectos aleatorios y esperemos que en un meta-regresión.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X