Lo siento si esto parece un poco básico, pero supongo que solo estoy buscando confirmar la comprensión aquí. Tengo la sensación de que tendría que hacer esto en dos pasos, y he comenzado a intentar entender las matrices de correlación, pero parece ser realmente complejo. Estoy buscando una explicación concisa (idealmente con sugerencias hacia una solución de seudocódigo) de una buena manera, idealmente rápida, de generar números aleatorios correlacionados.
Dados dos variables pseudoaleatorias altura y peso con medias y varianzas conocidas, y una correlación dada, creo que básicamente estoy tratando de entender cómo debería verse este segundo paso:
altura = gaussianPdf(altura.media, altura.varianza)
peso = gaussianPdf(media_correlacionada(altura.media, coeficiente_de_correlacion),
varianza_correlacionada(altura.varianza,
coeficiente_de_correlacion))
- ¿Cómo calculo la media y varianza correlacionadas? Pero quiero confirmar que ese es realmente el problema relevante aquí.
- ¿Necesito recurrir a la manipulación de matrices? ¿O tengo algo más muy erróneo en mi enfoque básico de este problema?
1 votos
No estoy seguro de entenderte correctamente, pero no necesitas calcular "media y varianza correlacionadas". Si estás asumiendo que las variables son normalmente bivariadas, debería ser suficiente especificar las medias y varianzas individuales y la correlación. ¿Hay algún software en particular que quieras usar para esto?
3 votos
Los siguientes Qs están fuertemente relacionados y serán de interés: ¿Cómo definir una distribución de manera que las selecciones de ella se correlacionen con una selección de otra distribución preespecificada? & Generar una variable aleatoria con una correlación definida con una variable existente.
1 votos
También: ¿Cómo puedo generar datos con una matriz de correlación preespecificada?