Tengo que probar qué factores influyen en el juego de daño en los campos. Yo mapa de áreas con daño y los que no. No siempre fue posible asignar el 100% de un campo, por lo que también hay áreas donde es seguro. Desde la "unidad" el daño no es objetivo, ya que no es posible determinar dónde termina y el siguiente comienza, puse una cuadrícula sobre la zona y se calcula para cada celda, independientemente de la distancia a diferentes estructuras (bosques, caminos, etc.). Los datos resultantes este aspecto:
| damage | id | dist_forest | dist_maiz | dist_roads |...
|0 | 51| 30| 20| 70|...
|0 | 51| 20| 10| 60|...
|0 | 52| 60| 10| 80|...
|0 | 52| 40| 70| 10|...
|0 | 52| 20| 60| 50|...
|1 | 53| 10| 10| 50|...
|1 | 53| 05| 20| 30|...
|1 | 54| 20| 30| 20|...
|1 | 54| 30| 20| 90|...
|1 | 54| 40| 10| 10|...
(Tengo unos 100 polígonos individuales que conducen a 100000 líneas cuando se resolvió en metros cuadrados)
Yo quería usar una regresión logística binaria, con efectos aleatorios. Para resolver el problema de la no-independiente de los datos que yo era la adición de la identificación de los daños de los polígonos como un factor aleatorio. El modelo resultante fue como este:
glm <- glm(damage ~ dist_forest + dist_maiz + dist_roads + (1|cat), family=binomial(logit),data=data)
El problema ist ahora, que todos mis parámetros son altamente significativos. Ya le pedí que aquí , y se propuso un modelo especial para los datos espaciales.
si los datos son (sustancialmente) dependencia espacial, a continuación, estándar de las pruebas de significación no aplicar ninguna manera!
¿Alguien tiene alguna sugerencia de cómo proceder en el futuro?