Tengo una pregunta acerca de la correcta distribución a utilizar para crear un modelo con mis datos. He llevado a cabo un inventario forestal con 50 parcelas, cada parcela mide 20m x 50m. Para cada parcela, calculé el porcentaje de las copas de los árboles que los tonos de la tierra. Cada parcela tiene un valor, en porcentaje, para la cobertura del dosel. Los porcentajes en el rango de 0 a 0.95. Estoy haciendo un modelo del porcentaje de cobertura de árboles (Y variable), con una matriz de independiente X variables basados en imágenes de satélite y datos ambientales.
No estoy seguro de si debo usar una distribución binomial, ya que una variable aleatoria binomial es la suma de n ensayos independientes (es decir, variables aleatorias de Bernoulli). El porcentaje de los valores de la suma de los juicios; ellos son los porcentajes reales. Debo usar gamma, incluso a pesar de que no tiene un límite superior? Debo convertir los porcentajes de un número entero y el uso de Poisson, ya que se cuenta? Debo seguir con Gaussiano? No he encontrado muchos ejemplos en la literatura o en los libros de texto que tratan de modelo porcentajes de esta manera. Cualquier sugerencias o ideas son apreciados.
Gracias por sus respuestas. De hecho, la distribución beta es exactamente lo que necesito y es discutido a fondo en este artículo:
Eskelson, B. N., Madsen, L., Agar, J. C., & Temesgen, H. (2011). La estimación de Ribera vegetación de sotobosque cubren con la Beta de la regresión y modelos cópula. La Ciencia Forestal, 57(3), 212-221.
Estos autores utilizan el betareg paquete en R por Cribari-Neto y Zeileis.
El siguiente artículo aborda una buena manera de transformar una beta distribuida variable de respuesta cuando se incluye verdadero 0 y/o 1 en el rango de porcentajes:
- Smithson , M., y J. Verkuilen, 2006. Una mejor exprimidor de limón? El de máxima probabilidad de regresión con beta-distribuidos dependientes de variables, Métodos Psicológicos, 11(1):54 b 71.