4 votos

Estadísticas circulares para datos de sector discreto e irregular

Un colega quiere examinar la direccionalidad de la dispersión de anfibios hacia y desde un estanque. Él instaló una barrera de contención alrededor del estanque y colocó cubos en diferentes posiciones para capturar a los anfibios. Midió el ángulo desde el centro del estanque hasta cada cubo. Hay 23 cubos distribuidos alrededor del estanque; debido a limitaciones físicas, el ángulo entre cada cubo (y la longitud del arco resultante del sector) no es perfectamente regular.

Quiere usar métodos de estadística circular para examinar la direccionalidad (o, conversamente, la uniformidad). Los datos pueden tratarse como direcciones hacia cada cubo (con conteos) o como sectores alrededor de cada cubo (con conteos). Desafortunadamente, no encuentro una buena discusión en la literatura (o en CrossValidated) sobre qué tipo de métodos se prefieren para este tipo de diseño... ya que la mayoría de los métodos se basan en medidas continuas de dirección (o tiempo) alrededor del círculo unitario. Parece haber habido algún trabajo sobre métodos circulares para variables discretas, pero no parecen aplicarse a datos irregulares con intervalos relativamente grandes.

Un método ad hoc parece ser el uso de una prueba de bondad de ajuste chi-cuadrado basada en la comparación de conteos observados con conteos esperados (aquí basados en el tamaño total de la muestra multiplicado por la longitud del arco)... pero esto parece cuestionable debido al alto número de ceros para algunas especies (cubos donde no se capturaron anfibios) y la posible autocorrelación circular entre cubos vecinos (y por lo tanto falta de independencia).

He visto algunos artículos que han utilizado la prueba z de Rayleigh y la prueba de espaciado de Rao para datos de sectores, pero no estoy seguro si esto es "aceptable" o no (ya que no encuentro una discusión sobre las posibles dificultades). Pensé en intentar examinar el ajuste a una distribución paramétrica (como von Mises) para ver si estoy en la zona correcta, pero me siento inseguro al respecto.

Agradecería mucho cualquier orientación sobre qué métodos podrían ser más aplicables a este tipo de diseño... o si alguien pudiera indicarme en la dirección de un artículo o capítulo de libro donde se trate este tema. He ojeado el libro de Jammalamadaka y SenGupta... y la tabla de contenidos de monografías más recientes, pero no puedo encontrar ninguna discusión obvia sobre datos de sectores... y no puedo justificar gastar dinero en un libro sin estar seguro de si se trata ese contenido.

2voto

Nick Cox Puntos 22819

Daría que uno de los problemas que planteas no es la discreción, sino la resolución de la medición. Considera que incluso, por ejemplo, las direcciones al grado más cercano también están agrupadas, al igual que las alturas de las personas que a menudo vienen en centímetros o pulgadas.

En otras ciencias biológicas, de la Tierra o ambientales, es común que los datos lleguen como puntos cardinales N, E, S, O o como 8 o 16 puntos; o como horas del día (24 valores posibles). Por lo tanto, los datos tan gruesos como los mencionados de ninguna manera son excepcionales. Los análisis en los libros de Mardia muestran que la pérdida de información por agrupación es bastante leve.

Solo usaría la dirección del punto medio para cada categoría.

Considero que la prueba de chi-cuadrado es un mal método para los datos direccionales. Se está desechando toda la información sobre el orden circular. Las únicas posibles ventajas son que no necesitas un programa dedicado y que el método probablemente ya es familiar. Las pruebas de Rayleigh y Kuiper son mucho, mucho mejores.

Pero no veo que estas pruebas aborden el problema científico. ¿Cuál es la idea principal aquí? Según entiendo, la dirección es un predictor, no una respuesta, y los conteos son una respuesta. Eso parece implicar una regresión de Poisson con términos de seno y coseno para la dirección y desplazamientos para diferentes anchos de sector.

Además de implicar desplazamientos, la irregularidad del espaciado no es mucho más problema que la irregularidad de un predictor en una regresión normal o de vainilla. (De hecho, los datos son mucho mejores en términos de espaciado que la mayoría de los conjuntos de datos).

Algo que comúnmente no se discute (y para mí sorprendentemente) en los libros de estadísticas circulares es el uso de la dirección como predictor en modelos de regresión de otro tipo. Como dije, la forma más útil de avanzar es usar los términos de seno y coseno como predictores.

El libro que mencionas específicamente es el libro menos valioso sobre estadísticas circulares que jamás haya encontrado, siendo una mezcla idiosincrática de material y lleno de extraños errores tipográficos e inconsistencias.

Ver también

hilo reciente sobre libros de estadísticas direccionales

artículo sobre predictores trigonométricos

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X