7 votos

Análisis binomial de datos con todas las respuestas 0 para algunos grupos de tratamiento

Tenemos una serie de experimentos en los que medimos la transmisión del virus a las plantas cuando se exponen a insectos infectados por el virus durante diferentes periodos de tiempo, por lo que todos los experimentos tienen tipos similares de variables independientes y dependientes. En un experimento, hay 6 periodos de tiempo (de 1 a 24 horas) y se analizaron 25 plantas (individualmente) para cada periodo de tiempo. La respuesta para cada planta es sí o no (las plantas se puntúan como infectadas por el virus). En 2 de los intervalos de tiempo, todas las plantas dieron negativo para la infección por virus (0/25 para cada intervalo de tiempo).

Estoy utilizando PROC GLIMMIX en SAS para los análisis. Para todos los demás experimentos, el uso de una distribución binaria en la declaración del modelo da resultados razonables. Para el experimento en el que dos de los intervalos de tiempo tenían 0 plantas positivas, si utilizo una distribución binaria en la declaración del modelo, los errores estándar para los dos grupos con 0 transmisiones son enormes, distorsionando así los resultados.

Si utilizo una distribución binomial negativa (basada en el recuento de plantas positivas al virus), los resultados parecen razonables. Dado que se analizó el mismo número de plantas en cada intervalo de tiempo, este enfoque funciona, pero difiere de los demás experimentos.

¿Existe algún método para ajustar/contabilizar los ceros en los grupos de tratamiento que permita que la distribución binaria arroje resultados razonables?

4voto

patfla Puntos 1

El problema de los ceros es que los datos no descartan proporciones arbitrariamente pequeñas. Así que su información previa debe ser evaluada con más cuidado, porque en este caso todavía importa . Los detalles que son irrelevantes cuando la información previa queda "inundada" por los datos pueden ser importantes. En este tipo de problema, el tamaño de la población $N$ se vuelve importante, pero un binomio asume $N\to\infty$ lo que da resultados absurdos, si este límite se aplica demasiado pronto en los cálculos (como indican sus errores estándar).

En este caso, la aproximación es relativamente sencilla, basta con sustituir $\frac{0}{25}$ con $\frac{1}{27}$ que es una estimación bayesiana basada en una prioridad uniforme para la verdadera fracción de "infecciones positivas". Dado que está utilizando GLIMMIX, hacer algo más sofisticado probablemente arruinará su programa SAS.

Para ser coherentes, puede valer la pena sustituir todas las proporciones $\frac{r}{n}$ con $\frac{r+1}{n+2}$ - sin embargo, no debería influir demasiado en sus resultados.

1voto

pirho Puntos 1387

Creo que se trata de un experimento en el que es seguro suponer una relación monótona: a mayor tiempo de exposición, la probabilidad de infección no puede ser menor. Así que puedes hacer una regresión monótona/isotónica. Incluso puedes incorporar a tu modelo que la probabilidad de infección a tiempo=0 es 0.

0voto

Mike Puntos 978

Podría intentar una regresión logística exacta con proc logistic, pero entonces no podrá especificar efectos aleatorios en alguna parte de su modelo, lo que probablemente haga ahora ya que está utilizando proc mixed. Tendría que cambiar a efectos fijos pero podría mantener la distribución binomial de errores.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X