Así pues, estoy ejecutando PLS en un conjunto de datos genéticos con información fenotípica y genotípica. Tengo unos 1000 predictores binarios (X), que representan marcadores moleculares, para cada individuo. Mis variables indicadoras (Y) son el rendimiento en libras por acre de cada individuo.
Estoy prediciendo el rendimiento (Y) mediante marcadores moleculares (X) con unas 3 variables latentes. He realizado las predicciones y estoy satisfecho con la capacidad de predicción del modelo en función del genotipo.
Lo que quiero saber es: ¿Cómo puedo determinar el efecto que tiene cada marcador en la predicción de Y dentro de cada variable latente? Preferiblemente en unidades de Y (libras por acre).
Debo añadir que sé que hay modelos más apropiados para modelar los efectos de los marcadores individuales, pero me interesa principalmente comparar este modelo con otros, así como conocer algunos efectos de los marcadores predichos con fines explicativos.