Tengo dos conjuntos de variables en el mismo conjunto de datos. Por ejemplo, DATA_free y DATA_exp. Sin embargo, DATA_exp se compone de variables que son muy caras/difíciles de obtener, mientras que DATA_free siempre está disponible fácilmente.
Me preguntaba si era posible utilizar el Análisis de Correlación Canónica entre estos dos conjuntos de variables para poder encontrar una combinación lineal de variables en DATA_free que explique mejor lo que hace DATA_exp, con la esperanza de que, si la correlación entre las dos combinaciones lineales es lo suficientemente alta, pueda dejar de depender de DATA_exp para calcular mis resultados.
¿Es esto razonable? ¿Algún consejo/ejemplo que me pueda dar? ¿Es esto teóricamente correcto?