El ampliamente utilizado/mencionado/supuesto propiedad afín de las distribuciones normales multivariadas dice que:
Dado un vector aleatorio $x \in R^N$ con una distribución normal multivariante -- $x \sim N_x(\mu_x, \Sigma_x)$ -- entonces el vector aleatorio $y = Ax + b$ obtenida aplicando una transformación afín/lineal a $x$ también tiene una distribución normal --> $y \sim N_y(A\mu_x+b, A\Sigma_x A^T)$
La propiedad anterior es fácil de demostrar si $A$ es un $N \times N$ matriz escribiendo $x = A^{-1}(y-b)$ y sustituyéndolo por $N_x(\mu, \Sigma)$ como se muestra a continuación:
\begin {alineado} p_y(y) & \propto p_x(A^{-1}(y-b)) \\ & \propto exp\{-0,5 \times (A^{-1}(y-b)- \mu_x )^T \Sigma_x ^{-1}(A^{-1}(y-b)- \mu_x )\} \\ & = exp\{-0,5 \times (y - (A \mu_x + b))^T A^{-T} \Sigma_x ^{-1}A(y - (A \mu_x + b))\} \\ & = exp\{-0,5 \times (y - (A \mu_x + b))^T (A \Sigma_x A^T)^{-1}(y - (A \mu_x + b))\} \\ & \sim N_y(A \mu_x +b, A \Sigma_x A^T) \end {alineado}
Mis preguntas son las siguientes:
- ¿Se mantiene la propiedad afín incluso si A es un paisaje $M \times N$ matriz con $M < N$ ? (la mayoría de los libros de texto/notas de clase lo dicen y muchos trabajos lo asumen antes de derivar otras cosas)
- Si la propiedad afín es cierta, ¿cómo se demuestra? porque cuando A es un paisaje $M \times N$ matriz con $M < N$ no se puede calcular A^{-1} y por lo tanto no se puede expresar el vector aleatorio $x$ como $x = A^{-1}(y-b)$