En primer lugar, hay muchos, muchos tipos diferentes de simulación en las estadísticas, y aún más en los campos circundantes. Decir "Simulación" es tan útil como decir "Modelo", es decir, no mucho.
Basándome en el resto de tu pregunta, voy a suponer que te refieres a la simulación de Monte Carlo, pero incluso eso es un poco vago. Básicamente, lo que pasa es que repetidamente sacas muestras de a distribución (no tiene por qué ser normal) para hacer algún análisis estadístico de una población artificial con propiedades conocidas, pero aleatorias.
El propósito de esto tiende a caer en dos categorías:
¿Puede mi método manejar X? : Esencialmente, estás simulando una serie de muchas poblaciones aleatorias con una respuesta "correcta" conocida para ver si tu nueva técnica te devuelve dicha respuesta correcta. Como ejemplo básico, digamos que has desarrollado lo que crees que es una nueva forma de medir la correlación entre dos variables, X e Y. Simularías dos variables en las que el valor de Y depende del valor de X, junto con un poco de ruido aleatorio. Por ejemplo, Y = 0,25x + ruido. Luego crearía una población con algunos valores aleatorios de X, algunos valores de Y que fueran 0,25x + un número aleatorio, probablemente muchos miles de veces, y luego mostraría que, en promedio, su nueva técnica escupe un número que muestra correctamente que Y = 0,25x.
¿Qué pasa si? La simulación puede hacerse como un análisis de sensibilidad para un estudio existente. Digamos por ejemplo que he hecho un estudio de cohorte, pero sé que la medición de mi exposición no es muy buena. Clasifica incorrectamente el 30% de mis sujetos como expuestos cuando no deberían estarlo, y clasifica el 10% de mis sujetos como no expuestos cuando no deberían estarlo. El problema es que no tengo una prueba mejor, así que no sé cuál es cuál.
Tomaría mi población, y le daría a cada sujeto expuesto una oportunidad del 30% de cambiar a no expuesto, y a cada sujeto no expuesto una oportunidad del 10% de cambiar a expuesto. Luego haría miles de nuevas poblaciones, determinando al azar qué sujetos cambian, y volvería a hacer mi análisis. El rango de esos resultados me dará una buena estimación de cuánto podría cambiar el resultado de mi estudio si hubiera podido clasificar correctamente a todos.
Por supuesto, como siempre, hay una mayor complejidad, matiz y utilidad en la simulación, dependiendo de cuánto se quiera cavar.