He recogido datos ambientales sobre animales y estoy buscando ayuda sobre cómo tratar ciertas variables en las que un valor no numérico es informativo, pero también problemático. Tengo tres variables que dependen unas de otras: tronco, distancia al tronco y diámetro del tronco más cercano. Estas cualidades se miden dentro de un área de muestreo de 4 m de radio alrededor de un cuadrante de 1 m cuadrado, donde se encuentra el animal.
- En el caso de registro : NA significaría que no pude tomar muestras del cuadrante o del área de 4 metros circundante (inaccesible), Ninguno significa que no hay troncos presentes en el área de la muestra, lo que significa que podría lógicamente sea igual a 0.
- Para la distancia al registro, si registro es "ninguno" o "0", entonces NA no es apropiado porque, de nuevo, eso significa que no pude muestrear el espacio, pero un valor de '0' para la distancia al tronco significaría que el tronco estaba dentro del cuadrante de 1 m al cuadrado, lo cual es incorrecto si realmente no hay ningún tronco dentro del área de muestreo de 4 m. [El cuadrante de 1 m al cuadrado actúa como un proxy para todo el animal].
- Existe el mismo problema con el diámetro del tronco más cercano: NA significaría que no pude muestrear el espacio, pero un valor de 0 significaría que el diámetro del tronco midió '0 cm', y un tronco no puede tener un diámetro de cero de forma realista (en este experimento, los troncos eran trozos de madera de más de 7,5 cm de diámetro).
Por lo tanto, para la distancia y el diámetro del tronco más cercano, 0 no puede ser el resultado lógico si no hay un tronco, pero cero puede ser la distancia al tronco más cercano si hay troncos presentes. ¿Alguna sugerencia sobre cómo resolver este problema de caracteres frente a números para el análisis estadístico? La solución puede ser hacer estas variables categóricas con los valores de 'ninguno', '0-1', '1-2', etc, y tendría que retocar los modelos multivariantes que manejan medidas repetidas utilizando datos categóricos y numéricos.
El objetivo final es hacer un análisis multivariante con muchas variables ambientales para comparar el entorno elegido por el animal frente a los entornos disponibles elegidos al azar dentro del bosque.
Gracias de antemano.
0 votos
Posible duplicado de ¿Cómo se tratan las variables "anidadas" en un modelo de regresión?