¿Es totalmente equivalente refundir un modelo de regresión lineal multivariante como una regresión lineal múltiple? No me refiero a la simple ejecución de $t$ regresiones separadas.
He leído en algunos sitios (Bayesian Data Analysis -- Gelman et al., y Multivariate Old School -- Marden) que un modelo lineal multivariante puede ser fácilmente reparametrizado como la regresión múltiple. Sin embargo, ninguna de las dos fuentes lo explica en absoluto. Básicamente se limitan a mencionarlo y luego continúan utilizando el modelo multivariante. Matemáticamente, escribiré primero la versión multivariante,
$$ \underset{n \times t}{\mathbf{Y}} = \underset{n \times k}{\mathbf{X}} \hspace{2mm}\underset{k \times t}{\mathbf{B}} + \underset{n \times t}{\mathbf{R}}, $$ donde las variables en negrita son matrices con sus tamaños debajo. Como siempre, $\mathbf{Y}$ son datos, $\mathbf{X}$ es la matriz de diseño, $\mathbf{R}$ son residuos normalmente distribuidos, y $\mathbf{B}$ es lo que nos interesa para hacer inferencias.
Para reparametrizar esto como la conocida regresión lineal múltiple, simplemente se reescriben las variables como
$$ \underset{nt \times 1}{\mathbf{y}} = \underset{nt \times nk}{\mathbf{D}} \hspace{2mm} \underset{nk \times 1}{\boldsymbol{\beta}} + \underset{nt \times 1}{\mathbf{r}}, $$
donde las reparametrizaciones utilizadas son $\mathbf{y} = row(\mathbf{Y}) $ , $\boldsymbol\beta = row(\mathbf{B})$ y $\mathbf{D} = \mathbf{X} \otimes \mathbf{I}_{n}$ . $row()$ significa que las filas de la matriz están dispuestas de extremo a extremo en un vector largo, y $\otimes$ es el producto de kronecker o externo.
Entonces, si esto es tan fácil, ¿por qué molestarse en escribir libros sobre modelos multivariantes, estadísticas de prueba para ellos, etc.? Lo más eficaz es transformar primero las variables y utilizar las técnicas univariantes habituales. Estoy seguro de que hay una buena razón, pero me cuesta pensar en una, al menos en el caso de un modelo lineal. ¿Existen situaciones con el modelo lineal multivariante y errores aleatorios normalmente distribuidos en las que esta reparametrización no se aplique, o limite las posibilidades del análisis que pueda emprender?
Fuentes que he visto Marden - Multivariate Statistics: Old School. Ver secciones 5.3 - 5.5. El libro está disponible gratuitamente en: http://istics.net/stat/
Gelman et al. - Análisis bayesiano de datos. Tengo la segunda edición, y en esta versión hay un pequeño párrafo en el capítulo 19 "Modelos de regresión multivariante" titulado: "El modelo de regresión univariante equivalente"
Básicamente, ¿se puede hacer con el modelo de regresión lineal univariante equivalente todo lo que se podría hacer con el modelo multivariante? Si es así, ¿por qué desarrollar métodos para modelos lineales multivariantes?
¿Y con los enfoques bayesianos?