4 votos

Calcular el $\left|\frac{\text{d}}{\text{d}\mathbf{Y}}\left[A^{-1}\left(\mathbf{Y}-\boldsymbol{\mu}\right)\right]\right|$.

Deje $\mathbf{Y} \in \mathbb{R}^n$ ser un vector columna, $\boldsymbol{\mu} \in \mathbb{R}^n$, e $A$ $n\times n$ matriz de constantes que no dependen de la $\mathbf{Y}$.

Definición. $\boldsymbol{\Sigma} = AA^{T}$, y asumimos $\boldsymbol{\Sigma}$ es positiva definida (viene inmediatamente de $A$ ser invertible).

Calcular $\left|\dfrac{\text{d}}{\text{d}\mathbf{Y}}\left[A^{-1}\left(\mathbf{Y}-\boldsymbol{\mu}\right)\right]\right|$ con respecto a $|\boldsymbol{\Sigma}|$.

Problema. Realmente no he sido dado una definición de $\dfrac{\text{d}}{\text{d}\mathbf{Y}}\left[A^{-1}\left(\mathbf{Y}-\boldsymbol{\mu}\right)\right]$ para este problema, que es la "matriz de derivadas parciales" (no hay más explicación más allá de eso). Para aquellos de ustedes que están familiarizados con las estadísticas multivariantes, este es utilizado en la derivación de la PDF de la distribución normal multivariante.

Enfoque #1. Uso de la fórmula de cálculo que he encontrado en un libro distinto: $$\dfrac{\text{d}}{\text{d}\mathbf{Y}}\left[A^{-1}\left(\mathbf{Y}-\boldsymbol{\mu}\right)\right] = A^{-1}$$ y, a continuación, usar ese $A^{-1} = A^{T}\boldsymbol{\Sigma}^{-1}$: $$|A^{-1}| = |A^{T}||\boldsymbol{\Sigma}^{-1}| \Longleftrightarrow \left(|A^{-1}|\right)^2=|\boldsymbol{\Sigma}|^{-1} \implies |A^{-1}|=|\boldsymbol{\Sigma}|^{-1/2}\text{,}$$ que es exactamente lo que quiero.

Enfoque #2. Calcular la matriz de derivadas parciales elementwise, y tomar el determinante.

No tengo idea de cómo hacerlo de esta manera, y yo creo que es la manera de que mi texto me quiere abordar el problema. Por eso creo que debería ser algo como esto:

$$\dfrac{\text{d}}{\text{d}\mathbf{Y}}\left[A^{-1}\left(\mathbf{Y}-\boldsymbol{\mu}\right)\right] = \begin{bmatrix} \dfrac{\partial [a_1 (y_1 - \mu_1)]}{\partial y_1} & \cdots & \dfrac{\partial [a_1 (y_n - \mu_n)]}{\partial y_n} \\ \vdots & \vdots & \vdots \\ \dfrac{\partial [a_n (y_1 - \mu_1)]}{\partial y_1} & \cdots & \dfrac{\partial [a_n (y_n - \mu_n)]}{\partial y_n} \end{bmatrix}$$ donde $A^{-1}=[a_{ij}]$, $\boldsymbol{\mu}=[\mu_i]$ y $\mathbf{Y} = [Y_i]$.

Pensándolo bien, esto no parece correcto, porque creo que los elementos de la matriz resultante debe ser sumas de dinero.

¿Cómo puedo hacer a este problema utilizando el enfoque #2?

4voto

Casi tienes.

(En caso de que usted no sabe acerca de esto, voy a utilizar aquí Einstein, la convención de sumación sobre las reiteradas índice. Es decir, una suma igual a $\sum_ka^i_kb^k$ será escrito simplemente como $a^i_kb^k$.)

Llame al vector $A^{-1}({\bf Y} - \boldsymbol{\mu})\equiv {\bf F}({\bf Y})$. ${\bf F}$ es una función de mapeo de los vectores vectores, es decir, ${\bf F}:\mathbb{R}^n\rightarrow \mathbb{R}^n$. Su gradiente es una matriz de $\boldsymbol{\nabla}{\bf F}$ dada por $$(\boldsymbol{\nabla}{\bf F})^{ij}\,\equiv\,\frac{\partial {\bf F}^i}{\partial {\bf Y}^j}\,=\,\frac{\partial [(A^{-1})^i_k\,(y^k-\mu^k)]}{\partial y^j}$$.

Mediante su notación, la primera fila es $$\frac{\partial[a^1_k(y^k-\mu^k)]}{\partial y^1},\cdots,\frac{\partial[a^1_k(y^k-\mu^k)]}{\partial y^n}$$ y la última fila es $$\frac{\partial[a^n_k(y^k-\mu^k)]}{\partial y^1},\cdots,\frac{\partial[a^n_k(y^k-\mu^k)]}{\partial y^n}$$.

Claramente, $(\boldsymbol{\nabla}{\bf F})^{ij}\,=\,(A^{-1})^i_j$, que es el resultado que obtuvo anteriormente.

Nota: Si desea muestran de forma explícita el símbolo de la adición, la pendiente es $$(\boldsymbol{\nabla}{\bf F})^{ij}\,=\,\sum_k\frac{\partial [(A^{-1})^i_k\,(y^k-\mu^k)]}{\partial y^j}$$

1voto

Christopher A. Wong Puntos 12513

A veces es la pena para volver a la definición original de la (Tartas) derivado. Esto evita desordenado parciales o pasar a un particular; la derivada es lineal en el mapa, que es independiente del sistema de coordenadas que utiliza. Si $f(Y)$ es un vector de valores de la función de tomar el vector de la variable $Y$, luego por otro vector $V$ (con las mismas dimensiones de $Y$), la derivada direccional $df/dY$ $V$ es $$ \frac{df(Y)}{dY}(V) = \lim_{h \rightarrow 0} \frac{f(Y + hV) - f(Y)}{h}. $$ En su caso $f(Y) = A^{-1}(Y - \mu)$, por lo que si el trabajo fuera el límite anterior obtendrás el resultado que quería.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X