5 votos

Cómo asociar la salida probabilística de un clasificador Random Forest con la realidad

Actualmente estoy trabajando con el inventario forestal nacional de México. Se trata de un sistema de muestreo que recoge datos sobre el estado de los bosques en puntos repartidos por todo el país. Una de estas variables es cualitativa y se refiere al daño/degradación del suelo debido a muchas causas. Por ejemplo, las actividades de pastoreo. Esta variable también tiene asociado un grado ordinal de "daño" si lo hay, 1: 1%-20%, 2: 20%-40%... (no recuerdo exactamente el tamaño de los intervalos). Como ejercicio rápido tomé esta variable de pastos e ignoré el grado de daño. Sólo hice una variable binaria que indica que el daño está presente / no está presente. Luego entrené un clasificador Random Forest utilizando muchas variables de teledetección, topográficas y climatológicas. Estas variables están disponibles de pared a pared en el país, por lo que posteriormente puedo utilizar el modelo para generar un mapa. Si entreno el clasificador utilizando una muestra equilibrada entre 1's y 0's y hago una clasificación dura obtengo una precisión con CV de alrededor del 75%. Me interesa más generar un mapa de probabilidad de degradación por lo que no he equilibrado la muestra y he generado una clasificación suave. Esta sería la probabilidad de la clase 1 (la degradación está presente):

enter image description here

¿Tiene este ejercicio sentido para alguien? Mi verdadera preocupación es la interpretación. ¿Cómo se asocian estas probabilidades con lo que realmente ocurre en el país? ¿O alguien tiene un ejemplo de cuándo uno querría asociar una clasificación suave con un fenómeno de la vida real? Para mí tiene mucho más sentido pensar de forma difusa. Pero estoy perdido cuando se trata de describir lo que está pasando.

2voto

guest101 Puntos 21

¿ha leído la teoría de la degradación de la tierra? creo que el problema es que está intentando utilizar la RF para clasificar la degradación en un mapa estático, cuando la degradación es algo que ocurre con el tiempo. en la teoría de la degradación, tendría un estado de vegetación en el momento t0...tn, pero el mapa estático no puede utilizarse para evaluar un estado vegetativo en una serie temporal. cómo cambia un estado o un píxel con el tiempo sería la cuantificación de la degradación. las diferencias en un estado estático pueden deberse simplemente a un menor potencial de crecimiento, como las precipitaciones interanuales. yo utilizaría la RF para crear una estimación del estado vegetativo -por ejemplo, la biomasa o la producción para el año 2001- y luego repetiría este mapa para una serie temporal -digamos, 10 años-. hacer una regresión de los píxeles a lo largo del tiempo. cuando los píxeles disminuyen en una pendiente, se tiene degradación. cuando los píxeles son estables o están a 0, se tiene estabilidad o resiliencia del ecosistema. cuando los píxeles aumentan, se tiene la antitesis de la degradación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X