29 votos

¿Por qué LKJcorr es un buen método a priori para la matriz de correlaciones?

Estoy leyendo el capítulo 13 "Aventuras en la covarianza" en el ( magnífico ) libro Replanteamiento estadístico por Richard McElreath donde presenta el siguiente modelo jerárquico:

Model

( R es una matriz de correlaciones)

El autor explica que LKJcorr es una prioridad débilmente informativa que funciona como una prioridad regularizadora para la matriz de correlación. Pero, ¿por qué es así? ¿Qué características tiene la LKJcorr que la convierten en una buena prioridad para las matrices de correlación? ¿Cuáles son otras buenas distribuciones a priori utilizadas en la práctica para las matrices de correlación?

19voto

user777 Puntos 10934

La distribución LKJ es una extensión del trabajo de H. Joe (1). Joe propuso un procedimiento para generar matrices de correlación uniformemente sobre el espacio de todas las matrices de correlación definidas positivas. La contribución de (2) es que extiende el trabajo de Joe para mostrar que hay una manera más eficiente de generar tales muestras.

La parametrización utilizada habitualmente en programas como Stan permite controlar hasta qué punto las matrices muestreadas se parecen a las matrices de identidad. Esto significa que puede pasar suavemente de matrices de muestreo que son todas muy parecidas a las matrices de identidad a matrices de identidad. $I$ a matrices más o menos uniformes sobre matrices PD.

Una forma alternativa de muestreo a partir de matrices de correlación, denominada método de la "cebolla", se encuentra en (3). (Sin relación con la revista satírica de noticias probablemente).

Otra alternativa consiste en muestrear a partir de las distribuciones Wishart, que son semidefinidas positivas, y luego dividir las varianzas para dejar una matriz de correlaciones. Algunas desventajas del procedimiento Wishart/Inverse Wishart se analizan en Inconvenientes de la prioridad inversa de Wishart en modelos jerárquicos

(1) H. Joe. "Generación de matrices de correlación aleatorias basadas en correlaciones parciales". Revista de Análisis Multivariante , 97 (2006), pp. 2177-2189

(2) Daniel Lewandowski, Dorota Kurowicka, Harry Joe. "Generación de matrices de correlación aleatorias basadas en vides y método de la cebolla extendida". Revista de Análisis Multivariante , Volumen 100, Número 9, 2009, Páginas 1989-2001

(3) S. Ghosh, S.G. Henderson. "Comportamiento del método norta para la generación de vectores aleatorios correlacionados al aumentar la dimensión". ACM Transactions sobre modelado y simulación por ordenador (TOMACS), 13 (3) (2003), pp. 276-294

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X