22 votos

¿Cómo funciona el error típico?

Recientemente he estado investigando los entresijos del error estándar y me he visto incapaz de entender cómo funciona. Según tengo entendido, el error típico es la desviación típica de la distribución de las medias muestrales. Mis preguntas son:

- ¿cómo sabemos que el error típico es la desviación típica de las medias muestrales cuando normalmente tomamos una sola muestra?

- ¿por qué la ecuación para calcular el error típico no refleja la ecuación de la desviación típica para una sola muestra?

17voto

mat_geek Puntos 1367

Supongamos que $X_1, X_2, \ldots, X_n$ son independientes e idénticamente distribuidos. Estoy seguro de que te refieres a esta situación. Sea su media común $\mu$ y su varianza común sea $\sigma^2$ .

Ahora la media muestral es $X_b=\sum_i X_i/n$ . Linealidad de las expectativas muestra que la media de $X_b$ es también $\mu$ . La hipótesis de independencia implica la varianza de $X_b$ es la suma de las varianzas de sus condiciones. Cada uno de estos términos $X_i/n$ tiene varianza $\sigma^2/n^2$ (porque la varianza de una constante por una variable aleatoria es la constante al cuadrado por la varianza de la variable aleatoria). Tenemos $n$ idénticamente distribuidas tales variables a sumar, por lo que cada término tiene esa misma varianza. Como resultado, obtenemos $n \sigma^2/n^2 = \sigma^2/n$ para la varianza de la media muestral.

Normalmente no sabemos $\sigma^2$ por lo que debemos estimarlo a partir de los datos. Dependiendo del contexto, hay varias formas de hacerlo. Las dos estimaciones más comunes y de uso general de $\sigma^2$ son los varianza de la muestra $s^2 = \frac{1}{n}\sum_i(X_i-X_b)^2$ y un pequeño múltiplo de ella, $s_u^2 = \frac{n}{n-1}s^2$ (que es un estimador insesgado de $\sigma^2$ ). El uso de cualquiera de estos en lugar de $\sigma^2$ en el párrafo anterior y sacando la raíz cuadrada se obtiene el error típico en forma de $s/\sqrt{n}$ o $s_u/\sqrt{n}$ .

16voto

JW. Puntos 386

Sí, el error estándar de la media (SEM) es la desviación estándar (SD) de las medias. (Error estándar es otra forma de decir DE de una distribución muestral. En este caso, la distribución muestral es la media para muestras de un tamaño fijo, digamos N). Existe una relación matemática entre la SEM y la SD de la población: SEM = SD de la población / raíz cuadrada de N. Esta relación matemática es muy útil, ya que casi nunca disponemos de una estimación directa de la SEM, pero sí de una estimación de la SD de la población (es decir, la SD de nuestra muestra). En cuanto a su segunda pregunta, si recogiera varias muestras de tamaño N y calculara la media de cada muestra, podría estimar el SEM simplemente calculando la DE de las medias. Por tanto, la fórmula del SEM refleja la fórmula de la DE de una sola muestra.

7voto

Sean Hanley Puntos 2428

+1 a @JoelW. y @MichaelChernick. Quiero añadir un detalle a la respuesta de @JoelW. Señala que "casi nunca tenemos una estimación directa del SEM", lo cual es esencialmente cierto, pero vale la pena reconocer explícitamente una salvedad a esa afirmación. En concreto, cuando un estudio compara varios grupos/tratamientos (por ejemplo, placebo frente a fármaco estándar frente a fármaco nuevo), se suele utilizar un ANOVA para ver si todos son iguales. La hipótesis nula es que cada grupo se ha extraído de la misma población y, por tanto, las tres medias son estimaciones de la media poblacional. Es decir, la hipótesis nula en un ANOVA estándar supone que tienen una estimación directa del SEM. Consideremos la ecuación de la varianza de la distribución muestral de medias: $$ \sigma^2_{\bar x}=\frac{\sigma^2_{pop}}{n_j}, $$ donde $\sigma^2_{pop}$ es la varianza de la población, y $n_j$ es el número de grupos. Aunque no solemos realizar los cálculos de esta forma, podemos podría basta con utilizar fórmulas estándar para introducir los valores estimados y, con un mínimo de reordenación algebraica, formar el $F$ estadística así: $$ F=\frac{n_j\times s^2_{\bar x}}{s^2_{\text{pooled within group}}} $$ En este caso, realmente estaríamos utilizando la fórmula estándar (sólo aplicada sobre las medias de grupo), es decir: $$ s^2_{\bar x}=\frac{\sum_{j=1}^{n_j}(\bar x_j-\bar x_.)^2}{n_j-1}, $$ con $x_.$ siendo la media de las medias de los grupos.

En el sentido de que solemos creer que la hipótesis nula no es cierta, la observación de @JoelW. es correcta, pero yo trabajo sobre este punto, porque creo que la claridad que aporta es útil para entender estas cuestiones.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X