24 votos

¿Cuáles son algunas técnicas de muestreo de dos variables aleatorias correlacionadas?

Cuáles son algunas técnicas de muestreo de dos variables aleatorias correlacionadas:

  • si sus distribuciones de probabilidad distribuciones de probabilidad están parametrizadas (por ejemplo, log-normal)

  • si tienen distribuciones no paramétricas no paramétricas.

Los datos son dos series temporales para las que podemos calcular coeficientes de correlación no nulos. Deseamos simular estos datos en el futuro, suponiendo que la correlación histórica y la FCD de la serie temporal son constantes.

Para el caso (2), el análogo 1-D sería construir la FCD y muestrear a partir de ella. Así que supongo que podría construir un CDF bidimensional y hacer lo mismo. Sin embargo, me pregunto si hay una manera de acercarse utilizando los CDFs individuales de 1-D y de alguna manera vincular los picks.

Gracias.

3 votos

La vinculación de CDFs 1-D me hace pensar en cópula s. No estoy seguro de que te sirvan de algo.

28voto

Shawn Puntos 8120

Creo que lo que buscas es una cópula. Tienes dos distribuciones marginales (especificadas por cdfs paramétricas o empíricas) y ahora quieres especificar la dependencia entre las dos. Para el caso bivariado hay todo tipo de opciones, pero la receta básica es la misma. Utilizaré una cópula gaussiana para facilitar la interpretación.

Para extraer de la cópula gaussiana con matriz de correlación $C$

  1. Dibujar $(Z=(Z_1, Z_2)\sim N(0, C)$

  2. Establecer $U_i = \Phi(Z_i)$ para $i=1, 2$ (con $\Phi$ la fdc normal estándar). Ahora $U_1, U_2\sim U[0,1]$ pero son dependientes.

  3. Establecer $Y_i = F_i^{-1}(U_i)$ donde $F_i^{-1}$ es la (pseudo) inversa de la CDF marginal de la variable $i$ . Esto implica que $Y_i$ seguir la distribución deseada (este paso no es más que un muestreo por transformación inversa).

¡Voilà! Pruébalo para algunos casos sencillos, y mira los histogramas marginales y los gráficos de dispersión, es divertido.

Sin embargo, no hay garantía de que esto sea apropiado para su aplicación particular (en particular, puede que tenga que sustituir la cópula gaussiana por una cópula t), pero esto debería servirle para empezar. Una buena referencia sobre el modelado de cópulas es Nelsen (1999), Introducción a las cópulas pero también hay muy buenas presentaciones en línea.

3 votos

+1 Nelsen es bastante legible. Me compré un ejemplar hace unos años, incluso después de haber revisado mucho material online.

1 votos

He encontrado un estupendo documento tutorial y una hoja de cálculo que lo acompaña: behan.ws/copula.pdf y soa.org/files/xls/rsrch-copula-ex.xls

1 votos

@Pete, efectivamente el papel es bonito. El enlace de la hoja de cálculo, en cambio, está muerto

4voto

user150025 Puntos 19

Otro método popular es la "reducción trivariada", que muestrea $X_1 \sim Y+Z$ y $X_2 \sim W+Z$ para que la correlación sea inducida por la variante aleatoria $Z$ . Tenga en cuenta que esto también se puede generalizar a más de 2 dimensiones, pero es más complicado que el caso de 2 dimensiones. Se podría pensar que sólo se pueden obtener correlaciones positivas, pero en realidad también se pueden obtener correlaciones negativas utilizando $U$ y $(1-U)$ al generar las variantes aleatorias, esto inducirá una correlación negativa en las distribuciones.

Un tercer método popular es (NORTA) NORMA A CUALQUIER COSA generar variantes normales correlacionadas, convertirlas en variantes aleatorias uniformes mediante la evaluación de sus respectivas fdc, y luego utilizar estas "nuevas" variantes aleatorias uniformes como fuente de aleatoriedad para generar extracciones de la nueva distribución.

Además del enfoque de la cópula (toda una clase de métodos) que se menciona en otro post, también se puede muestrear a partir de la distribución de acoplamiento máximo, que es similar en espíritu al enfoque de la cópula. Se especifican las distribuciones marginales y la muestra del acoplamiento máximo. Esto se logra mediante 2 pasos de aceptación-rechazo como lo describe Pierre Jacob aquí . Es de suponer que este método puede extenderse a dimensiones superiores a 2, pero podría ser más complicado de conseguir. Nótese que el acoplamiento máximo inducirá una correlación que depende de los valores de los parámetros de los marginales ver este para un buen ejemplo de esto en la respuesta de Xi'an a mi pregunta.

Si está dispuesto a aceptar muestras aproximadas (en la mayoría de los casos), entonces Técnicas MCMC son también una opción para muestrear desde distribuciones multidimensionales.

Además, podría utilizar aceptar-rechazar métodos, pero suele ser difícil encontrar una densidad dominante de la que tomar muestras y evaluar la relación de ésta con la densidad deseada.

Estos son todos los métodos adicionales que se me ocurren, pero probablemente haya un par que se me hayan pasado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X