Mis datos consisten en aproximadamente cien visitas de animales a tres zonas de alimentación diferentes, y estoy tratando de determinar si hubo una preferencia por una zona sobre las demás.
Cada animal visita entre una y aproximadamente cien zonas (piense en colibríes y comederos).
El problema es que 1) la secuencia de zonas que visita un animal dado probablemente no es independiente porque cada animal individual puede tener sus propias preferencias, y 2) las visitas de diferentes animales probablemente no son independientes, porque es posible (probablemente) que, digamos, el primer animal y el quinto sean los mismos (no son identificables), por lo que las dos secuencias de visitas a zonas por el primero y el quinto pueden estar altamente correlacionadas.
Si todo fuera independiente, entonces podría usar una prueba de chi cuadrado.
¿Alguna sugerencia?
Ediciones basadas en los comentarios: Los datos son así:
bird1<-c(1,2,1,1,3,2,1,2)
bird2<-c(3,2,1,2,1,2,3,2,1,3,2,3,2,1)
bird3<-c(1)
...
birdn<-c(2,3,1)
donde 1, 2 y 3 son etiquetas para las zonas visitadas antes de que el pájaro dejara el área.
Ahora, cualquier pájaro puede tener sus propias preferencias. Y el pájaro 1 puede ser el pájaro 3, porque una vez que salen del área, si regresan, no tenemos forma de saber si era el mismo pájaro (una vez que está fuera de la vista).
La hipótesis nula sería que las tres zonas son igualmente preferidas; la hipótesis alternativa sería que alguna zona es preferida.
Si todo fuera independiente, podría hacer una prueba de chi-cuadrado comparando las frecuencias observadas con c(1/3,1/3,1/3)
, pero puede haber dependencia aquí, y las simulaciones pueden ser difíciles porque no hay un modelo obvio para la dependencia.