Las ponderaciones de los casos en una regresión multivariante (de resultados múltiples) no tienen el significado directo que tienen en los mínimos cuadrados ponderados con una sola variable de resultado. Entonces, cada peso representa idealmente la inversa de la varianza del valor del resultado correspondiente, con varianzas de error independientes entre los casos. En una regresión multivariante, esta interpretación de la ponderación de un caso supondría implícitamente que todos los resultados tienen las mismas varianzas relativas de un caso a otro. Además, una de las principales razones de la regresión multivariante es estimar las covarianzas entre los valores de los resultados.
Una solución sería aprovechar que, con un único resultado, una transformación de datos seguida de MCO proporciona los mismos coeficientes de regresión que mínimos cuadrados ponderados . Si se premultiplica cada una de las matrices de diseño y el vector de resultados por la matriz diagonal de las raíces cuadradas de las ponderaciones de los casos, entonces OLS da el mismo resultado que los mínimos cuadrados ponderados. Como los coeficientes de regresión devueltos por las regresiones multivariadas son los mismos que los producidos por las regresiones con cada una de las variables de resultado individualmente, sólo hay que extender esto a la premultiplicación de la matriz de resultados, si se está dispuesto a aceptar las consecuencias de cualquier inaplicabilidad de los pesos de los casos a una regresión multivariada. Transforme primero los datos y luego haga la regresión multivariante.
A pesar del temor planteado por el OP, lm()
maneja sin ponderar regresiones multivariantes bastante bien. Produce objetos "mlm" que contienen toda la información necesaria para la inferencia multivariante estándar. Véase Fox y Weisberg . La R stats
simplemente (y espero que por las razones señaladas anteriormente) se niega a procesar un ponderado regresión multivariante más allá de la estimación de los coeficientes.