La versión corta: ¿existe algún método estadístico que pueda utilizarse para elaborar estimaciones de abundancia, distribución espacial y/o tasa de propagación de una especie cuando mi conjunto de datos sólo incluye datos de presencia y no de ausencia? No estoy tratando con fósiles en sentido estricto, pero especulo que si tal método existe podría encontrarse en el campo de la paleontología.
Versión larga: Recientemente he emprendido un pequeño proyecto piloto para tratar de reunir datos sobre la distribución de una especie de polilla recientemente introducida en los Estados Unidos, y posiblemente proyectar hacia atrás y estimar la fecha y el lugar de introducción. Sólo tuvimos conocimiento de esta especie en 2009, pero busqué en bases de datos de fotografía de insectos (en su mayoría aportadas por aficionados: Guía de errores.net , mothphotographersgroup.org , etc. ) y encontré que había muchas fotos de esta bestia, que se remontan a 2004, y que abarcan 8 o 9 estados del sureste de Estados Unidos.
Me hizo pensar en cómo se podría utilizar un conjunto de datos de este tipo. Estas fotos son funcionalmente iguales a un registro fósil, en el sentido de que los puntos de datos positivos son escasos pero intrínsecamente muy informativos porque representan una fecha y una localidad definitivas para el organismo en cuestión. Por otro lado, los datos negativos verdaderos son aún más escasos (lo que significa que existen datos que demuestran que el organismo no estaba presente en un lugar y momento determinados). Hay un tercer tipo de "datos" que no sé si se puede utilizar: la ausencia de datos positivos.
Por un lado, si no existen datos positivos de un determinado lugar, dice tanto de las condiciones de creación del "fósil" (o de la foto) y de su posterior recolección como de la distribución de la especie. En el caso de los fósiles, imagino que las condiciones son geológicas/topográficas, mientras que en el caso de las fotos se refieren a la densidad de fotógrafos potenciales y a la probabilidad de que publiquen una foto donde pueda encontrarla.
Por otro lado, no es lo mismo no tener datos que no tener información, ¿no? Si estandarizo la densidad de población humana, los científicos ciudadanos de todo Estados Unidos deberían tener una probabilidad equivalente de encontrar una polilla y fotografiarla. Si la densidad de polillas por fotógrafo es alta, habrá una mayor probabilidad de que se tome una foto. Si la densidad de polillas es baja, habrá menos posibilidades de hacer una foto. Si la polilla está realmente ausente, la posibilidad de hacer una foto es nula. Dicho de otro modo, no creo que sea al azar* que todas las fotos son de estados del sureste, y que se encontraron más fotos de algunos estados que de otros entre ese grupo. Sólo que no sé si hay una manera de apoyar estadísticamente esto basado en el tipo de datos que tengo.
* Revelación completa: Sé que no es aleatorio. No quería añadir otro nivel de complicación a mi pregunta, pero la distribución de su árbol huésped está bien documentada y representa un límite absoluto para esta polilla.