Estoy usando la regresión logística para estimar ~probabilidad de que una unidad de la muestra a ser utilizada por un animal.
Debido a mi diseño de muestreo es inevitable que existe una superposición entre "usado" las unidades de la muestra y 'disponible' unidades de la muestra. (Superposición se refiere a la situación donde "usado" unidades de producirse también en la muestra de 'disponible' unidades. Es decir, unidades de muestreo con características idénticas son codificados como '0' y '1' en los datos. Por lo que la situación no es análogo a un caso de control de la aplicación de la regresión logística.)
Según Johnson et al 2006 "la Selección de Recursos de Funciones Basadas en el Uso–Disponibilidad Datos: Teoría de la Motivación y los Métodos de Evaluación";
"Cuando se solapan, las estimaciones de la variación reportada por el regresión logística de procedimiento para los coeficientes no son correctos, incluso a pesar de que los coeficientes de las estimaciones. Si no se solapan, la varianza estimaciones son correctas. Coeficiente de varianzas en el caso de superposición debe ser estimado por bootstrap métodos de remuestreo distintas las unidades".
Mi pregunta es, ¿incorrecta coeficiente de varianzas implica incorrecto registro de las probabilidades? Lo pregunto porque quiero comparar a unos 10 modelos con AIC, pero parece que tendría que bootstrap de las desviaciones para cada uno de los coeficientes del modelo por separado y, a continuación, calcular la probabilidad, y luego usar mi modelo de procedimiento de selección.
Gracias por todos los pensamientos