10 votos

¿Puedo utilizar el bootstrapping, por qué o por qué no?

Actualmente estoy trabajando en la estimación de la biomasa mediante imágenes de satélite. Definiré rápidamente los antecedentes de mi pregunta y luego explicaré la cuestión estadística en la que estoy trabajando.

Antecedentes

Problema

Estoy tratando de estimar la biomasa en una zona de Francia. Mi respuesta es la densidad de volumen de la madera de vapor (en $m^3/ha$ ), que es más o menos proporcional a la biomasa (dependiendo de las densidades de la madera...).

Las variables independientes que tengo son los índices de vegetación derivados de las reflectancias medidas sobre esta zona (el satélite utilizado en el estudio es MODIS para los que lo conocen). Estos índices son por ejemplo NDVI, EVI, etc. Tengo mapas de los índices, y la resolución de los mapas es de 250m.

Existen fuertes correlaciones entre estos índices y el volumen en un mismo tipo de bosque (bioma y clima). Así que estoy tratando de hacer una regresión de la densidad de volumen frente a estos indicadores (en realidad sus series temporales) en las parcelas de inventario donde conozco el volumen.

Inventarios forestales

El volumen en estas parcelas se estima con el siguiente método de muestreo:

  1. Los nodos del inventario se colocan en una cuadrícula regular que cubre la zona.
  2. A cada nodo se le adjunta una parcela, y el proceso de inventario (tipos de árboles, volúmenes, altura del dosel, etc.) se produce en esta parcela. Por supuesto, sólo me interesa la parcela de inventario y los valores de mis índices de vegetación es el valor del píxel que contiene la parcela.
  3. El proceso de inventario en una parcela es el siguiente:

    http://i.stack.imgur.com/DeHdC.png

    • Medida de los árboles que tienen un diámetro > 37,5cm en el círculo de 15m de radio
    • Medida de los árboles que tienen un diámetro > 22,5cm en el círculo de 9m de radio
    • Medida de los árboles que tienen un diámetro > 7,5cm en el círculo de 6m de radio

A continuación, se calcula la densidad volumétrica mediante factores de expansión.

Para cada parcela tengo acceso a los datos de todos los árboles medidos.

Además, para cada árbol individual, tengo una incertidumbre sobre el volumen debido al uso de ecuaciones alométricas (digamos un 10%).

Donde las estadísticas son importantes...

Para que mis regresiones sean más precisas, necesito para cada estimación de volumen la varianza/CI de esta medida. Esto depende, OMI, del número de árboles muestreados y de la densidad de volumen encontrada.

Así que tengo dos problemas:

  1. ¿Cómo tener en cuenta que mis índices de vegetación se miden en un píxel de 250 m?

    Puedo suponer que la densidad de volumen es constante en un píxel, y que muestro este píxel con una parcela de inventario.

  2. ¿Cómo estimar la variabilidad de mi densidad de volumen?

    Creo que podría usar bootstrapping en la población de árboles. Pero mi número total de árboles medidos puede ser bastante pequeño (de 7 a 20...). Además, ¿cómo puedo tener en cuenta el hecho de que estoy midiendo los árboles en diferentes círculos dependiendo de su tamaño? ¿Y cómo debería cambiar la variabilidad si miro un píxel entero?

También estaba pensando que podría utilizar una simulación de Montecarlo para simular un bosque, y luego hacer un muestreo aleatorio de este bosque con parcelas para ver qué pasa...

No tengo una gran formación estadística, así que estoy un poco perdido.

1voto

guest47 Puntos 186

No entiendo muy bien tus datos, pero puedo decirte que una alternativa al bootstrap multinomial que funciona mejor para eventos raros es la perturbación / bootstrap salvaje. La perturbación es extremadamente flexible y a menudo es capaz de manejar datos no-iid, sin embargo a veces se necesita una gran cantidad de delicadeza para aproximar correctamente la cdf. Si consigue especificar correctamente la fórmula de bootstrap, hará menos suposiciones y probablemente estará menos sesgado que el método de suavizado sugerido anteriormente, especialmente teniendo en cuenta su conjunto de datos dispersos, que puede hacer que las estimaciones de densidad sean inestables.

0voto

jws121295 Puntos 36

Si tuviera que abordar este problema, empezaría por:

  1. mirando un mapa de los datos de origen
  2. intentar algún tipo de alisado 2d en la superficie, tratar de informarlo con AIC
  3. calcular la derivada de la suavidad en el lugar y relacionar la variación de la entrada con la variación de la salida mediante el método delta
  4. Comparar los resultados con algunos valores "conocidos" para verificar/validar el enfoque

Enlaces relevantes: http://www.stanford.edu/class/cme308/notes/TaylorAppDeltaMethod.pdf http://www.ingentaconnect.com/content/klu/stco/2010/00000020/00000004/00009140?crawler=true

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X