17 votos

Transformación lineal de una variable aleatoria mediante una matriz rectangular de altura

Supongamos que tenemos un vector aleatorio $\vec{X} \in \mathbb{R}^n$, elaborado a partir de una distribución con función de densidad de probabilidad $f_\vec{X}(\vec{x})$. Si nos linealmente transformar por completo rango de $n \times n$ matriz $A$ conseguir $\vec{Y} = A\vec{X}$, entonces la densidad de $\vec{Y}$ está dada por $$ f_{\vec{Y}}(\vec{y}) = \frac{1}{\left|\det a\right|}f_{\vec{X}}(A^{-1}\vec{y}). $$

Ahora dicen que transformar $\vec{X}$ lugar por un $m \times n$ matriz$B$,$m > n$, dando $\vec{Z} = B\vec{X}$. Claramente $Z \in \mathbb{R}^m$, pero "vive en" una $n$-dimensiones subespacio $G \subset \mathbb{R}^m$. ¿Cuál es la densidad condicional de $\vec{Z}$, dado que sabemos que se encuentra en $G$?

Mi primer instinto fue el uso de la pseudo-inversa de a $B$. Si $B = U S V^T$ es la descomposición de valor singular de a$B$, $B^+ = V S^+ U^T$ es la pseudo-inversa, donde $S^+$ está formado por la inversión de la no-cero entradas de la diagonal de la matriz $S$. Yo supuse que esto daría $$ f_\vec{Z}(\vec{z}) = \frac{1}{\left|\det^+ S\right|} f_\vec{X}(B^+ \vec{z}), $$ donde por $\det^+ S$ me refiero a que el producto de la no-cero valores singulares.

Este razonamiento está de acuerdo con la densidad de una singular normal (acondicionado en el conocimiento de que la variable vive en la correspondiente subespacio) dado aquí y mencionó también aquí y en este CrossValidated post.

Pero no es correcta! La normalización constante está apagado. Un (trivial) contraejemplo es dada por considerar el siguiente caso: Con $X \sim \mathcal{N(0, 1)}$, vamos $$ \vec{Y} = \begin{pmatrix}1 \\ 1\end{pmatrix} X = \begin{pmatrix}X \\ X\end{pmatrix}. $$ Aquí la matriz $B$ desde el anterior es sólo los vectores. Su pseudo-inversa es de $$ B^+ = \begin{pmatrix}1/2 & 1/2\end{pmatrix} $$ y $\det^+ B = \sqrt{2}$. El razonamiento de arriba sugeriría $$ f_\vec{Y}(\vec{y}) = \frac{1}{\sqrt{2\pi}\sqrt{2}}\exp\left(-\frac{1}{2}\vec{y}^T (B^+)^T B^+ \vec{y}\right), $$ pero en realidad este se integra (en la línea $y = x$)$\frac{1}{\sqrt{2}}$. Me doy cuenta de que en este caso sólo podía caer en una de las entradas de $\vec{Y}$ está hecho, pero al $B$ es mucho más grande identificar el conjunto de entradas para la gota es molesto. ¿Por qué no la pseudo-inversa de razonamiento de trabajo? Hay una fórmula general para la función de densidad de una transformación lineal de un conjunto de variables aleatorias por un "alto" de la matriz? Las eventuales referencias que se agradecería mucho así.

6voto

linkboss Puntos 56

Para aquellos que podría ejecutar todo esto en el futuro... el origen del error, en realidad se deriva de la integración. En el ejemplo anterior, la integración se lleva a cabo a través de la línea $y = x$. Por lo tanto, es necesario "parametrizar" la línea y considerar el Jacobiano de la parametrización de la hora de tomar la integral, ya que cada unidad de paso en el $x$-eje corresponde a los pasos de longitud $\sqrt{2}$ sobre la línea. La parametrización estaba implícitamente el uso fue dado por $x \mapsto (x, x)$, en otras palabras, especificando ambos idénticos entradas de $\vec{y}$ en valor. Esto ha Jacobiana $\sqrt{2}$, lo que claramente se cancela con el $\sqrt{2}$ (procedente de la exactamente la misma Jacobiana) en el denominador.

El ejemplo fue artificialmente simple - por una transformación general $B$, uno puede tener otra parametrización para la salida que es natural en el contexto del problema. Desde la parametrización de las necesidades a cubrir el mismo subespacio $G$$B$, y este subespacio es un hyperplane, la parametrización es en sí misma probabilidad de ser lineal. Llamar a la $m \times n$ representación de la matriz de la parametrización de la $L$, el requisito es, simplemente, que tienen la misma columna espacio como $B$ (cubierta de la misma hyperplane). Luego de la densidad final se convierte en $$ f_{\vec{Z}}(\vec{z}) = \frac{\left|\det^+ L\right|}{\left|\det^+ B\right|}f_{\vec{X}}(B^+ \vec{z}). $$

En general, esta configuración es una especie de extraño, y creo que la mejor cosa a hacer es encontrar a un máximo linealmente independientes conjunto de filas de $B$, y eliminar el resto de las filas (junto con los correspondientes componentes de la variable transformada $\vec{z}$) para obtener una matriz cuadrada $\hat B$. Entonces el problema se reduce a la de rango completo $n \times n$ de los casos (suponiendo $B$ total columna de la fila).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X