12 votos

ANOVA con observaciones no independientes

Perdón por la verborrea de esta pregunta:

A veces, en las investigaciones sobre el comportamiento animal, el experimentador se interesa por el tiempo que un sujeto pasa en distintas zonas predefinidas de un aparato de ensayo. A menudo he visto este tipo de datos analizados mediante ANOVA; sin embargo, nunca me ha convencido del todo la validez de tales análisis, dado que ANOVA supone que las observaciones son independientes, y en realidad nunca lo son en estos análisis (¡ya que más tiempo pasado en una zona significa que se pasa menos en otras zonas!).

Por ejemplo,

D. R. Smith, C. D. Striplin, A. M. Geller, R. B. Mailman, J. Drago, C. P. Lawler, M. Gallagher, Comportamiento de ratones que carecen de receptores dopaminérgicos D1A receptores dopaminérgicos Neurociencia, Volume 86, Issue 1, 21 May 1998, Pages 135-146

En el artículo anterior, reducen los grados de libertad en 1 para compensar la no independencia. Sin embargo, no estoy seguro de cómo una manipulación de este tipo puede realmente mejorar esta violación de los supuestos del ANOVA.

¿Quizás sería más apropiado un procedimiento de chi-cuadrado? ¿Qué haría usted para analizar datos como éstos (preferencia por las zonas, basada en el tiempo pasado en ellas)?

Merci !

5voto

BBlake Puntos 310

Mike,

Estoy de acuerdo en que un ANOVA basado en el tiempo total probablemente no sea el enfoque correcto en este caso. Además, no estoy convencido de que Chi Sqaure resuelva su problema. Chi cuadrado respetará la idea de que no se puede estar en dos lugares al mismo tiempo, pero no aborda el problema de que es probable que existan dependencias entre el tiempo N y el tiempo N+1. En cuanto a esta segunda cuestión, veo algunas analogías entre su situación y lo que la gente se encuentra con el ojo y el ratón de seguimiento de datos. Un modelo multinomial de algún tipo puede servir bien a tus propósitos. Por desgracia, los detalles de ese tipo de modelo están más allá de mis conocimientos. Estoy seguro de que algún libro de estadística en algún lugar tiene un pequeño manual sobre ese tema, pero de la parte superior de mi cabeza que le apunte hacia:

  • Barr D.J. (2008) Analyzing 'visual world' eyetracking data using multilevel logistic regression. Journal of Memory and Language, Número especial: Emerging Data Analysis (59) pp 457-474
  • https://r-forge.r-project.org/projects/gmpm/ es un enfoque no paramétrico de la misma cuestión que está desarrollando el Dr. Barr

En todo caso, esas dos fuentes deberían ser más que completas porque entran en cómo analizar el curso temporal de la posición.

4voto

jldugger Puntos 7490

Busque modelos con errores correlacionados espacialmente (y covariables correlacionadas espacialmente). Una breve introducción, con referencias a GeoDa está disponible aquí . Hay muchos textos; los buenos son los de Noel Cressie , Robert Haining y Fotheringham et al (el último enlace lleva a un resumen, no al sitio del libro). Recientemente ha aparecido algo de código R, pero no estoy familiarizado con él.

3voto

Matt Mitchell Puntos 17005

(Caveat Emptor: no soy experto en la materia)

Si sólo quiere hablar de diferencias en el tiempo empleado por ubicación, entonces presentar los datos de "tiempo por ubicación" como recuentos en un modelo mixto multinomial (véase el paquete MCMCglmm para R), utilizando el sujeto como efecto aleatorio, debería ser suficiente.

Si quiere hablar de diferencias en la preferencia de ubicación a través de tiempo, luego quizás dividir el tiempo en intervalos razonables (¿quizás a la resolución de su dispositivo de cronometraje?), clasificar cada intervalo según la ubicación del ratón en ese momento (por ejemplo, si hay 3 ubicaciones, cada intervalo se etiqueta como 1, 2 o 3), y de nuevo utilizar un modelo multinomial de efectos mixtos con el sujeto como efecto aleatorio pero esta vez añadiendo el intervalo como efecto fijo (aunque posiblemente sólo después de factorizar el intervalo, lo que reduce la potencia pero debería ayudar a capturar las no linealidades a través del tiempo).

3voto

Voy a sugerir una respuesta muy diferente a la de un ANOVA tradicional. Sea T el tiempo total de que dispone un animal para pasar en todas las zonas. Se podría definir T como la cantidad total de tiempo de vigilia o algo parecido. Supongamos que tenemos J zonas. Entonces, por definición, tenemos

Suma T_j = T

Se puede normalizar lo anterior dividiendo las hl y las hdr por T y se obtiene

Suma P_j = 1

donde P_j es la proporción de tiempo que un animal pasa en la zona j.

Ahora la pregunta que tienes es si P_j es significativamente diferente de 1 / J para todos los j.

Se podría suponer que P_j sigue una distribución de dirichlet y estimar dos modelos.

Modelo nulo

Establezca los parámetros de la distribución de forma que P_j = 1 / J. (Basta con establecer los parámetros de la distribución en 1.)

Modelo alternativo

Establezca los parámetros de la distribución para que sean una función de las covariables específicas de la zona. A continuación, puede estimar los parámetros del modelo.

Elegiría el modelo alternativo si supera al modelo nulo según algún criterio (por ejemplo, la razón de verosimilitud).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X