Inspirado por mi reciente asistencia a una conferencia de toxicología ambiental, tengo la siguiente pregunta sobre las barras de error:
Supongamos que extraigo muestras de una distribución desconocida, con media y varianza finitas. Quiero presentar la media muestral y añadir algunas barras de error. Como no sé mucho sobre la distribución subyacente, añado barras de error que muestren +/- la desviación típica de las muestras.
Mi pregunta es: ¿hay alguna forma de indicar con certeza esas barras de error? Añadir barras de error a las barras de error, por así decirlo.
Como ejemplo, he extraído 5 muestras de alguna distribución, y lo he repetido 5 veces. A continuación se muestran las medias muestrales y las barras de error de +/- las desviaciones típicas muestrales.
Podemos ver que, por casualidad, estas medias muestrales y barras de error parecen bastante diferentes, y no son realmente compatibles entre sí. Por supuesto, 5 muestras no es mucho, pero si mis muestras se obtienen mediante algún procedimiento experimental enrevesado (capturar un animal salvaje y tomar una muestra de sangre, por ejemplo), puede que no sea una opción fácil obtener más muestras.
Actualización:
Sólo para añadir algunas notas sobre cómo estaba pensando:
Yo mismo, que procedo de la física computacional, estoy acostumbrado a los métodos de Monte Carlo, y el $1/\sqrt{N}$ -que se deduce del teorema del límite central. Así que, al igual que el error en la media muestral tiene una distribución esperada, pensé que quizás tendría sentido preguntarse por el error esperado en la desviación típica muestral. Por supuesto, el problema es que la distribución del error en la media de la muestra se expresa en términos de la varianza (desconocida) de la distribución subyacente, y por lo tanto me quedo tomando la desviación estándar de la muestra, o algo por el estilo.
Pero aún así, pensé que debería haber alguna forma de indicar que la desviación típica de mi muestra es en sí misma bastante incierta, debido a la pequeña $N$ . Pero quizás la única manera sea simplemente hacer una lista $N$ y ser explícito sobre lo que muestran las barras de error.
19 votos
Encontrado en XKCD: xkcd.com/2110
1 votos
Puede consultar la distribución de la varianza muestral que relaciona la varianza de la muestra con el cuarto momento central de las muestras. He utilizado esta cantidad en el pasado para estimar barras de error en ruido cuántico (donde la varianza es la señal).