6 votos

¿Es correcto que no se haga una simulación estadística utilizando $2^{256}$ (o más) salidas de un prng de CMM?

En una conversación sobre el generador de números pseudoaleatorios Multiply-With-Carry de Marsaglia y su posible uso para generar datos aleatorios con fines estadísticos, alguien dijo

No hay ninguna simulación estadística que utilice $2^{256}$ salidas de dicho generador.

¿Es eso correcto?

  • Si "sí" - ¿Hay alguna explicación que pueda ayudarme a entender por qué esto es correcto? ¿Y hay algún otro propósito estadístico en el que más de $2^{256}$ de una salida de prng de CMM se utilizaría?
  • Si "no" - ¿Puede darme el nombre de una simulación estadística que pueda mencionar como ejemplo?

La razón por la que pregunto es porque (siendo un stats-noob) confié en que Marsaglia (siendo un stats-guru) tenía una buena razón para desarrollar el prng del MWC con su "período casi récord" . Pero ahora, me cuesta entender para qué fines estadísticos podría ser útil el prng de la CMM si realmente es cierto que ninguna simulación estadística utilizará $2^{256}$ (o más) salidas de dicho generador.

14voto

AdamSane Puntos 1825

Es un poco difícil decir que 'ninguna simulación estadística siempre ', ya que la eternidad es un tiempo muy largo y es posible que encontremos formas de hacer cosas que ahora no vemos.

Sin embargo, en el futuro inmediato, $2^{256}$ o $\sim 10^{77}$ simulaciones es tantos órdenes de magnitud más allá de lo que seríamos capaces de generar en un tiempo razonable con los conocimientos actuales de computación (por no hablar de lo que podríamos necesitar realmente con fines estadísticos, que bien podría ser incluso menos) que dudo que se acerque remotamente antes de que el CMM sea una nota a pie de página olvidada en los anales de la generación de números aleatorios. Puede ser difícil de apreciar bastante de lo grande que es esa cantidad.

Imagina que tienes $7\times 10^{18}$ núcleos (a mil millones de núcleos para todas y cada una de las personas del planeta ), cada una de ellas gritando a mil millones de simulaciones por segundo. Dejémoslo correr durante un siglo (alrededor de $\pi$ mil millones de segundos). Eso sería una simulación de un tamaño aproximado de $10^{-40}$ veces $2^{256}$ . Tendrías que dejarlo correr durante $10^{40}$ siglos

(La tierra ha existido durante un poco más de $4\times 10^7$ siglos)

Así que no en un futuro próximo.

(Y si suponemos tecnologías como los ordenadores cuánticos... ¿por qué íbamos a utilizar el CMM?)

Desde el punto de vista práctico, creo que la persona que citas tiene razón. Mucho antes de que nos acerquemos a esa cuestión, habremos dejado de utilizar la CMM.

(Mi respuesta evita deliberadamente abordar cualquier cuestión sobre la idoneidad de la CMM en general, ya que no es directamente relevante para la pregunta, aunque sería una consideración si se llega a utilizar para algo).


En cuanto a la razón por la que alguien desarrollaría un generador con un periodo mucho más largo del que podría necesitar para cualquier simulación; una de las ventajas es que no tiene que preocuparse por la dependencia entre dos simulaciones con diferentes semillas: si hago una simulación hoy con una semilla y otra mañana con una segunda semilla, los conjuntos de números aleatorios que obtenga casi nunca se solaparán.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X