Soy nuevo en R y en análisis de datos hiperespectrales. Sin embargo, en mi investigación, he descubierto que muchos advierten contra el uso del análisis discriminante paso a paso (usando el Lambda de Wilk o la distancia de Mahalanobis) para encontrar el mejor subconjunto de variables con el cual se puede obtener un rendimiento de discriminación 'satisfactorio'.
Me he encontrado con algunas sugerencias:
PLS: http://cran.r-project.org/web/packages/pls/ and
LARS: http://cran.r-project.org/web/packages/lars/index.html, and I am just realizing that maybe the answers provided to this link below might be useful:
What are modern, easily used alternatives to stepwise regression?.
Dada la naturaleza de los datos hiperespectrales (altamente correlacionados y altamente redundantes), me gustaría encontrar las primeras 10 bandas que sean más eficientes para discriminar entre cerca de 30 especies de plantas. Cualquier sugerencia sería muy valorada.