¡Hola a todos y feliz año nuevo! Que todas vuestras esperanzas y aspiraciones se hagan realidad y que las fuerzas del mal se vean confundidas y desorientadas de camino a vuestra casa.
Con eso fuera del camino...
Estoy intentando escribir un código informático que obtenga un vector μ∈Rn y la matriz Σ∈Rn×n y genera muestras aleatorias de la distribución normal multivariante con media μ y la covarianza Σ .
El problema : Sólo se me permite utilizar el programa para tomar muestras del solo distribución normal variable con media 0 y la varianza 1 : N(0,1) .
La solución propuesta : Definir un vector de ceros (inicialmente) v∈Rn , ahora para todos i de 1 à n , extraer de una dist. normal de una sola variable: vi∼N(0,1) .
Ahora haz una descomposición de Cholesky en Σ : Σ=LLT .
Ahora finalmente el vector aleatorio que queremos que se distribuya de la gaussiana multivariante es Lv+μ .
Mi pregunta es ¿Por qué? No entiendo la intuición, si fuera una distribución unidimensional N(μ,σ2) entonces entiendo por qué σ2v+μ es una buena idea, ¿por qué Cholesky? ¿No querríamos Σv+μ ?
2 votos
Hay un fallo en su comprensión: En el caso unidimensional nuestra muestra aleatoria es σv+μ no σ2v+μ . En el caso multivariante Σ desempeña el papel de σ2 .
0 votos
Aun así, ¿por qué la "raíz" de la covarianza sería cholesky? Puedo ver por qué parece similar, pero creo que exige una explicación. ¿Y si hay otra matriz A que no es L tal que AAT=Σ ? ¿Por qué no sería un buen ajuste en lugar de L ?