3 votos

Ajuste de bondad para datos posiblemente dependientes

Mis datos consisten en aproximadamente cien visitas de animales a tres zonas de alimentación diferentes, y estoy tratando de determinar si hubo una preferencia por una zona sobre las demás.

Cada animal visita entre una y aproximadamente cien zonas (piense en colibríes y comederos).

El problema es que 1) la secuencia de zonas que visita un animal dado probablemente no es independiente porque cada animal individual puede tener sus propias preferencias, y 2) las visitas de diferentes animales probablemente no son independientes, porque es posible (probablemente) que, digamos, el primer animal y el quinto sean los mismos (no son identificables), por lo que las dos secuencias de visitas a zonas por el primero y el quinto pueden estar altamente correlacionadas.

Si todo fuera independiente, entonces podría usar una prueba de chi cuadrado.

¿Alguna sugerencia?

Ediciones basadas en los comentarios: Los datos son así:

bird1<-c(1,2,1,1,3,2,1,2)
bird2<-c(3,2,1,2,1,2,3,2,1,3,2,3,2,1)
bird3<-c(1)

...

birdn<-c(2,3,1)

donde 1, 2 y 3 son etiquetas para las zonas visitadas antes de que el pájaro dejara el área.

Ahora, cualquier pájaro puede tener sus propias preferencias. Y el pájaro 1 puede ser el pájaro 3, porque una vez que salen del área, si regresan, no tenemos forma de saber si era el mismo pájaro (una vez que está fuera de la vista).

La hipótesis nula sería que las tres zonas son igualmente preferidas; la hipótesis alternativa sería que alguna zona es preferida.

Si todo fuera independiente, podría hacer una prueba de chi-cuadrado comparando las frecuencias observadas con c(1/3,1/3,1/3), pero puede haber dependencia aquí, y las simulaciones pueden ser difíciles porque no hay un modelo obvio para la dependencia.

1voto

Nick Cox Puntos 22819

Lo que realmente son los datos no está claro, por lo que sería útil que se indique qué datos podría introducir en una prueba de chi-cuadrado (por ejemplo). Ejemplos reales o realistas serían de gran ayuda.

A primera vista, esto parece ser excesivamente pesimista. Por lo general, para algo como una prueba de chi-cuadrado, el punto de referencia o situación de referencia (hipótesis nula, en términos más tradicionales) es la independencia y si los datos reales muestran algo diferente es precisamente la pregunta. Así que, en esta historia, cualquier tipo de dependencia es interesante, no un problema.

Si esto no interpreta correctamente el problema, entonces es probable que necesite configurar modelos de simulación con supuestos plausibles para tener una idea de lo que podría esperar.

La identificabilidad de individuos es presumiblemente un problema conocido en su campo.

(ACTUALIZAR) Dado que las aves no son individualmente identificables con certeza, ¿cuánto se pierde al colapsar en una tabla de visitas a cada zona y probar eso contra la independencia? La prueba de chi-cuadrado podría ser un desafío aquí porque las frecuencias esperadas son todas bajas, pero podría tener una idea de la distribución de muestreo mediante simulación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X