Estoy estudiando la perturbación causada por el tráfico de barcos a un pequeño de aves marinas. He observado focal de los animales para una cantidad de tiempo y registrar si o no ellos vuelan desde el agua durante la observación. Este pájaro no vuela a altas probabilidades cuando no perturbado (aproximadamente el 10% del tiempo). Post hoc, he anexado a la distancia más cercana a la nave para cada observación (barcos de interés localizadores GPS grabación de un punto cada 5 seg.).
He trazado la función de distribución acumulativa para TODAS las observaciones y de las observaciones en las que el pájaro voló desde el agua como una función de la distancia más cercana a la nave. Como era de esperar, la mayoría de las observaciones en la que el pájaro voló se observaron cuando el barco estaba cerca.
¿Puedo utilizar el test de Kolmogorov-Smirnov para comprobar si hay una diferencia estadística en la distribución del vuelo de las observaciones y el total de observaciones? Mi pensamiento es si estas dos distribuciones son diferentes, se podría sugerir que la nave distancia tiene una influencia sobre el vuelo. Me preocupa ya que estas funciones de distribución no son independientes como el vuelo de las observaciones son un subconjunto del total de observaciones.
Los pensamientos?
Después de haber leído un poco más en este sitio creo que puedo probar la distribución de las observaciones en las que el vuelo se produjo (F) en contra de la distribución de las observaciones en las que no lo hicieron (NF), ya que estos son independientes. Si estas distribuciones son la misma F=NF, entonces podemos asumir que la distribución de (F) y (TOT = todas las observaciones son las mismas que sabemos que la distribución de (F) es igual a sí mismo y (F)+(T) = (TOT). A la derecha?
ACTUALIZACIÓN: 2/12/14
Siguiendo las sugerencias de @Scortchi he investigado la relación de la incidencia de vuelo vs distancia más cercana a la nave en una regresión logística marco. Hubo una ligera relación presente (pendiente negativa), pero el valor de p fue no significativo, lo que sugiere que la verdadera pendiente podría ser cero. Basado en el desciptive estadísticas (incluyendo la ecdf parcelas) tengo la sospecha de que el efecto de cierre de las naves estaba siendo ahogado por las muchas observaciones que cuando el barco no estaba afectan al comportamiento. A continuación, utiliza el paquete de R segmentado (http://cran.r-project.org/web/packages/segmented/segmented.pdfpara intentar encontrar un punto de ruptura en el modelo. El programa encontró que la ruptura de los datos a 2,6 km de la nave y ajuste independiente de dos coeficientes era mejor que el único modelo de coeficiente. El coeficiente de la pendiente de la estrecha nave enfoques fue negativo y sugiere que los buques que afectan a la respuesta del vuelo hasta alrededor de 2.6 km (p-valor < 0.001). El coeficiente para la segunda vertiente fue ligeramente positivo, pero el valor de p no fue significativa en el nivel alfa de 0.05 (p-valor = 0.11). Así que en resumen, la segmentación de la línea de regresión fue capaz de detectar un umbral de diferencia en que vuelo probabilidad aumenta. La estimación de la probabilidad de vuelo cuando el barco está a más de 2.6 km es de 0,11. Como era de esperar, he observado 79 aves en cuando no hay barcos estaban incluso en el estudio de la bahía (> 100 km) y el 9 de estos individuos voló desde el agua durante el tiempo de observación (0.113 probabilidad).
Gracias por todas las sugerencias. Espero que esta pregunta junto con las sugerencias y respuestas que ayuda a los demás.