5 votos

Cálculo de la región de mayor densidad dada una distribución normal multivariante con dimensión $d$ > 3

Antecedentes :

Supongamos que tengo una distribución simétrica unimodal de dimensión $d$ > 3 como la distribución normal multivariante ~ N(0, H), donde H es una $d$ -matriz de covarianza de una dimensión.

Pregunta :

Estoy interesado en encontrar el Región de mayor densidad que cubre el 95% del área bajo esta distribución. Ahora, entiendo la noción de Regiones de Máxima Densidad en el caso univariante y bivariante y cómo proceder para obtenerlas utilizando por ejemplo el hdrcde paquete. Sin embargo, me interesa lo siguiente: ¿Cómo obtengo la Región de Máxima Densidad dado el supuesto de distribución de normalidad multivariante y un $d$ -matriz de covarianza H donde $d$ =10 por ejemplo?

Idea de cómo proceder :

Soy consciente de que en el caso de distribuciones simétricas unimodales como la distribución normal multivariante considerada en la pregunta, la $\alpha$ % HDR coincide con el $\alpha$ % de cuantiles de la distribución. Podría utilizar un algoritmo basado en cuadrículas para aproximar estos cuantiles, por ejemplo. La idea sería definir M puntos de rejilla para cada dimensión de forma que se cubra el espacio relevante. Esto llevaría a M^ $d$ valores conjuntos de la red para $d$ -distribución dimensional. Luego evaluaría la pdf de la densidad normal multivariada en cada punto de la cuadrícula conjunta. Y luego a partir de esta M^ $d$ de densidades no estoy seguro de cómo proceder para obtener $\alpha$ -cuantiles.

Cualquier sugerencia sobre cómo proceder será bienvenida. Cualquier otro enfoque de cómo obtener Regiones de Alta Densidad para un $d$ -distribución normal de dimensiones con $d>2$ también son más que bienvenidos ya que creo que M^ $d$ las evaluaciones de las funciones pueden volverse lentas en dimensiones más altas. Gracias por adelantado.

8voto

Mark L. Stone Puntos 2037

La región de mayor densidad de un $N(0,H)$ La variable aleatoria es un elipsoide centrado en su media, $0$ y orientado por la matriz de covarianza $H$ . El valor de corte del elipsoide puede determinarse a partir del Chi-cuadrado con $d$ grados de libertad.

Dejemos que $y =$ tal que el Chi-cuadrado con $d$ grados de libertad $\le 0.95$ . A continuación, la región de mayor densidad que captura $0.95$ probabilidad de la $N(0,H)$ es
$$x: x^TH^{-1}x \le y$$

Por ejemplo, cuando $d = 10, y = 18.307038$ .

0 votos

Gracias por la respuesta. Sigue habiendo cierta confusión en la determinación del valor de corte que he formulado en un contexto detallado aquí . ¿Quizás pueda indicarme la dirección correcta? Muchas gracias por su tiempo.

0 votos

El $-2log(\alpha)$ sólo se aplica a d =2, y es el resultado del chisquar cuando d = 2. No hay ninguna incoherencia. Si no te sale lo mismo cuando d = 2, entonces estás cometiendo un error en alguna parte. También hay que tener en cuenta que los límites del elipsoide se pueden determinar recorriendo sqrt(y)*sqrt(eigenvalue) a lo largo del correspondiente vector propio de H desde el origen.

0 votos

-2log( $\alpha$ ) y chisquare efectivamente me sale lo mismo cuando d=2. No hay ninguna incoherencia. También compruebo todas las soluciones aleatorias para x si satisfacen la condición $x^T H^{-1} x = \chi^2(\alpha)$ . Sólo que no estoy completamente seguro de que mi interpretación de la media mínima de todas las soluciones obtenidas corresponda a la pérdida máxima (valor en riesgo) con $\alpha$ por ciento de probabilidad. De manera que, por ejemplo, para y=chisquare(0,95) la solución media mínima obtenida corresponde a la pérdida máxima con una probabilidad del 95%, es decir, el VaR $_{0.05}$ . En este punto, obtengo unos mínimos bastante bajos para el contexto.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X