19 votos

¿Cómo implementar un modelo mixto utilizando la función betareg en R?

Tengo un conjunto de datos compuesto por proporciones que miden el "nivel de actividad" de los renacuajos individuales, por lo que los valores están delimitados entre 0 y 1. Estos datos se recogieron contando el número de veces que el individuo se movió en un determinado intervalo de tiempo (1 para el movimiento, 0 para la ausencia de movimiento), y luego se promediaron para crear un valor por individuo. Mi efecto fijo principal sería el "nivel de densidad".

El problema al que me enfrento es que tengo una variable factorial, "estanque", que me gustaría incluir como efecto aleatorio; no me importan las diferencias entre estanques, pero me gustaría tenerlas en cuenta estadísticamente. Un punto importante sobre los estanques es que sólo tengo 3 de ellos, y entiendo que es ideal tener más niveles de factores (5+) cuando se trata de efectos aleatorios.

Si es posible hacerlo, me gustaría que me aconsejaran sobre cómo aplicar un modelo mixto utilizando betareg() o betamix() en R. He leído los archivos de ayuda de R, pero normalmente los encuentro difíciles de entender (lo que cada parámetro del argumento realmente significa en el contexto de mis propios datos Y lo que los valores de salida significan en términos ecológicos) y por eso tiendo a trabajar mejor a través de ejemplos.

En una nota relacionada, me preguntaba si puedo utilizar en su lugar un glm() bajo una familia binomial, y enlace logit, para lograr la contabilización de los efectos aleatorios con este tipo de datos.

28voto

Abby Fichtner Puntos 1316

El paquete glmmTMB puede ser útil para quien tenga una pregunta similar. Por ejemplo, si quisiera incluir el estanque de la pregunta anterior como efecto aleatorio, el siguiente código serviría:

glmmTMB(y ~ 1 + (1|pond), df, family=list(family="beta",link="logit"))

16voto

Daniel Lew Puntos 39063

Las capacidades actuales de betareg no incluyen efectos aleatorios/mixtos. En betareg() sólo puede incluir el efecto fijo, por ejemplo, para su variable de estanque de tres niveles. La página web betamix() implementa una función finita mezcla regresión beta, no una mixto efectos de la regresión beta.

En tu caso, primero intentaría ver qué efecto tiene un factor fijo de estanque. Esto le "cuesta" dos grados de libertad, mientras que un efecto aleatorio sería un poco más barato con sólo un grado de libertad adicional. Pero me sorprendería que los dos enfoques condujeran a conocimientos cualitativos muy diferentes.

Por último, mientras glm() no admite la regresión beta, pero en el mgcv paquete existe el betar() que se puede utilizar con la familia gam() función.

5voto

Awais Tariq Puntos 116

Esto empezó como un comentario, pero se alargó. No creo que un modelo de efectos aleatorios sea apropiado aquí. Sólo hay 3 estanques -- ¿quieres estimar una varianza a partir de 3 números? Eso es más o menos lo que va con un modelo de efectos aleatorios. Supongo que los estanques fueron elegidos por su conveniencia para el investigador, y no como una muestra aleatoria de los "estanques de las Américas".

La ventaja de un modelo de efectos aleatorios es que permite construir un intervalo de confianza sobre la respuesta (nivel de actividad) que tiene en cuenta la variación entre estanques. Un modelo de efectos fijos -en otras palabras, tratar el estanque como un bloque- ajusta la respuesta para el efecto del estanque. Si hubiera algún efecto de tratamiento adicional -por ejemplo, dos especies de ranas en cada estanque- el bloqueo reduce el error cuadrático medio (denominador de la prueba F) y permite que el efecto del tratamiento salga a la luz.

En este ejemplo, no hay efecto del tratamiento y el número de estanques es demasiado pequeño para un modelo de efectos aleatorios (y probablemente demasiado "no aleatorio"), por lo que no estoy seguro de qué conclusiones se pueden extraer de este estudio. Se podría obtener una buena estimación de la diferencia entre los estanques, pero eso es todo. No veo que se puedan hacer inferencias a la población más amplia de ranas en otros estanques. Se podría enmarcar como un estudio piloto, supongo.

Hay que tener en cuenta que cualquier uso de un modelo de efectos aleatorios va a dar una estimación muy poco fiable de la varianza del estanque y debe utilizarse con precaución.

Pero en cuanto a tu pregunta original, ¿no es más bien un problema de tarifas? La distribución que se utiliza para los eventos por unidad de tiempo es la de Poisson. Así que se podría hacer una regresión de Poisson utilizando los recuentos con el intervalo de tiempo como desplazamiento.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X