Supongamos que tengo una muestra de datos reales y a partir de ella creo un conjunto de nuevas muestras con reemplazo. A continuación, calculo las medias de cada muestra "sintética" que he generado.
Mi primera pregunta es la siguiente. Supongo que se aplica el teorema del límite central y que la distribución de estas medias será normal, o al menos se acercará a la normalidad a medida que aumente el tamaño del número de muestras generadas. ¿Es eso cierto?
Si esto es cierto, supongo que los percentiles 2,5 y 97,5 de la distribución de las medias serán simétricos aunque la distribución original a partir de la cual se generaron las muestras sintéticas no fuera normal. ¿Es eso cierto?
Estoy un poco confundido en estos puntos, ya que pensé que el intervalo de confianza sería asimétrico si la distribución subyacente también era asimétrica. He hecho simulaciones y parece que obtengo intervalos asimétricos, pero esto podría deberse a que no estoy muestreando lo suficiente (he generado 500.000 muestras) y, como se ha sugerido anteriormente, el teorema del límite central sugiere que la distribución debería ser normal.