5 votos

Estimación de la distribución de las especies y del ritmo de expansión utilizando sólo datos positivos

La versión corta: ¿existe algún método estadístico que pueda utilizarse para elaborar estimaciones de abundancia, distribución espacial y/o tasa de propagación de una especie cuando mi conjunto de datos sólo incluye datos de presencia y no de ausencia? No estoy tratando con fósiles en sentido estricto, pero especulo que si tal método existe podría encontrarse en el campo de la paleontología.

Versión larga: Recientemente he emprendido un pequeño proyecto piloto para tratar de reunir datos sobre la distribución de una especie de polilla recientemente introducida en los Estados Unidos, y posiblemente proyectar hacia atrás y estimar la fecha y el lugar de introducción. Sólo tuvimos conocimiento de esta especie en 2009, pero busqué en bases de datos de fotografía de insectos (en su mayoría aportadas por aficionados: Guía de errores.net , mothphotographersgroup.org , etc. ) y encontré que había muchas fotos de esta bestia, que se remontan a 2004, y que abarcan 8 o 9 estados del sureste de Estados Unidos.

Me hizo pensar en cómo se podría utilizar un conjunto de datos de este tipo. Estas fotos son funcionalmente iguales a un registro fósil, en el sentido de que los puntos de datos positivos son escasos pero intrínsecamente muy informativos porque representan una fecha y una localidad definitivas para el organismo en cuestión. Por otro lado, los datos negativos verdaderos son aún más escasos (lo que significa que existen datos que demuestran que el organismo no estaba presente en un lugar y momento determinados). Hay un tercer tipo de "datos" que no sé si se puede utilizar: la ausencia de datos positivos.

Por un lado, si no existen datos positivos de un determinado lugar, dice tanto de las condiciones de creación del "fósil" (o de la foto) y de su posterior recolección como de la distribución de la especie. En el caso de los fósiles, imagino que las condiciones son geológicas/topográficas, mientras que en el caso de las fotos se refieren a la densidad de fotógrafos potenciales y a la probabilidad de que publiquen una foto donde pueda encontrarla.

Por otro lado, no es lo mismo no tener datos que no tener información, ¿no? Si estandarizo la densidad de población humana, los científicos ciudadanos de todo Estados Unidos deberían tener una probabilidad equivalente de encontrar una polilla y fotografiarla. Si la densidad de polillas por fotógrafo es alta, habrá una mayor probabilidad de que se tome una foto. Si la densidad de polillas es baja, habrá menos posibilidades de hacer una foto. Si la polilla está realmente ausente, la posibilidad de hacer una foto es nula. Dicho de otro modo, no creo que sea al azar* que todas las fotos son de estados del sureste, y que se encontraron más fotos de algunos estados que de otros entre ese grupo. Sólo que no sé si hay una manera de apoyar estadísticamente esto basado en el tipo de datos que tengo.

* Revelación completa: Sé que no es aleatorio. No quería añadir otro nivel de complicación a mi pregunta, pero la distribución de su árbol huésped está bien documentada y representa un límite absoluto para esta polilla.

6voto

SpaceghostAli Puntos 3732

Existe una amplia literatura sobre este tema en la ecología espacial; pero todo se reduce a qué tipo de suposiciones estás dispuesto a hacer. Un método muy común para estimar las distribuciones espaciales a partir de los datos de abundancia es un enfoque de máxima entropía, eche un vistazo al programas informáticos y publicaciones

Hay una variedad de otros algoritmos diseñados para este propósito también (utilizando métodos como las redes neuronales), en su mayoría cayendo en la clase de métodos de aprendizaje de máquinas donde simplemente se está probando lo bien que una caja negra puede reproducir los datos (es decir, en la validación cruzada entre un conjunto de entrenamiento y un conjunto de prueba) en lugar de estimar los modelos subyacentes. En consecuencia, es difícil decir algo sobre la idoneidad estadística de los enfoques fuera de los conjuntos de datos en los que se han probado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X