1 votos

Error estándar de la media estimada de la suma o del producto

Pregunta actualizada : Dadas dos medias muestrales ( $\bar X, \bar Y$ ) y las desviaciones estándar de la muestra ( $S_X, S_Y$ ) con diferentes tamaños de muestra ( $n_X, n_Y$ ), quiero calcular los errores estándar ( $SE_\theta, SE_\rho$ ) de la estimación suma ( $\theta$ ) y producto ( $\rho$ ) significa.

Las medias y las desviaciones típicas de las muestras se calculan como

$\bar X = \frac{\sum\limits_{i=1}^{n_X} X_{i}}{n_X}$ , $S_X = \sqrt{\frac{\sum\limits_{i=1}^{n_X} (X_{i} - \bar X)^2}{n_X - 1}}$ , $\bar Y = \frac{\sum\limits_{i=1}^{n_Y} Y_{i}}{n_Y}$ y $S_Y = \sqrt{\frac{\sum\limits_{i=1}^{n_Y} (Y_{i} - \bar Y)^2}{n_Y - 1}}$

donde $n_X \neq n_Y$ .

Para aclarar, proporciono dos ejemplos inventados en los que las variables $X$ y $Y$ se supone que son independientes:

Suma : Imagina una población de tiburones que pasa 5 ± 0,2 h d $^{–1}$ ( $\bar X \pm S_X$ ) alimentándose de hierbas marinas y 3 ± 0,1 h d $^{–1}$ ( $\bar Y \pm S_Y$ ) alimentándose de peces. La primera media se basa en 20 tiburones muestreados ( $n_X$ = 20), la segunda sobre 10 ( $n_Y$ = 10). Si quiero estimar la media de la suma, utilizo $\theta = \bar X + \bar Y$ . En este ejemplo $\theta$ = 8 h d $^{–1}$ .

Producto : Imagine un bosque con una densidad media de 10 ± 3 plantas m $^{-2}$ ( $\bar X \pm S_X$ ) y una tasa fotosintética media de 20 ± 0,5 $\mu$ mol O $_2$ planta $^{-1}$ min $^{-1}$ ( $\bar Y \pm S_Y$ ). La primera media se basa en 15 mediciones repetidas ( $n_X$ = 15), la segunda sobre 40 ( $n_Y$ = 40). Si quiero estimar la media del producto, utilizo $\rho = \bar X\bar Y$ . En este ejemplo $\rho$ = 200 $\mu$ mol O $_2$ m $^{-2}$ min $^{-1}$ .

Quiero saber cómo calcular $SE_\theta$ y $SE_\rho$ utilizando la información proporcionada en cada ejemplo.

La respuesta aceptada a esta pregunta proporciona esta ecuación para $SE_\theta$ :

$SE_\theta = \sqrt{\frac{S_Y^2}{n_Y} + \frac{S_X^2}{n_X}}$

Este documento tan útil proporciona esta ecuación para $SE_\rho$ :

$SE_\rho = \sqrt{\frac{\bar X^2S_Y^2}{n_Y} + \frac{\bar Y^2S_X^2}{n_X} + \frac{S_X^2S_Y^2}{n_Xn_Y}}$

¿Son correctas estas ecuaciones?

Respuesta : Mientras tanto, he encontrado mi propia respuesta y he pensado que podría ser útil compartirla aquí. Las ecuaciones para el error estándar de la media de la suma ( $SE_\theta$ ) y el error estándar de la media del producto ( $SE_\rho$ ) son correctos. Se derivan de $Var(\bar X + \bar Y) = Var(\bar X) + Var(\bar Y)$ y $Var(\bar X\bar Y) = E(X)^2Var(\bar Y) + E(Y)^2Var(\bar X) + Var(\bar X)Var(\bar Y)$ .

Cuando los errores estándar de $\bar X$ y $\bar Y$ se dan, $SE_\theta$ y $SE_\rho$ se puede calcular como

$SE_\theta = \sqrt{SE_\bar X^2 + SE_\bar Y^2}$ y $SE_\rho = \sqrt{\bar X^2SE_\bar Y^2 + \bar Y^2SE_\bar X^2 + SE_\bar X^2SE_\bar Y^2}$

donde $SE_\bar X = \frac{S_X}{\sqrt{n_X}}$ y $SE_\bar Y = \frac{S_Y}{\sqrt{n_Y}}$ .

0voto

user103292 Puntos 6

La 2ª ecuación no puede ser exactamente correcta ya que implica que cuando ambas medias muestrales son 0, $\sigma_3$ debe ser 0. Parece que tus fuentes para la 2ª ecuación están ignorando el $Var(X)Var(Y)$ bajo el supuesto de que su tamaño será insignificante en comparación con los otros términos.

La 1ª ecuación es una mejor aproximación, según la derivación dada en el post de Cross Validated que enlazaste, asumiendo que $\sigma_1, \sigma_2$ son las desviaciones típicas de $\bar{x}_1, \bar{x}_2$ , no las desviaciones estándar de la muestra. (Intuición: a medida que aumente el tamaño de las muestras, las desviaciones típicas de las muestras convergerán con la desviación típica de la población, pero la desviación típica de las estimaciones de $\bar{x}_1, \bar{x}_2$ debería converger a 0, por lo que la desviación estándar en su estimación de $\bar{x}_3$ debería converger a 0). Para ser exactos, habría que utilizar las verdaderas medias poblacionales en lugar de las medias muestrales.

Edit: releyendo tu pregunta no queda claro si estás buscando el error estándar en la estimación de la media del producto (esto es lo que significa "quiero calcular la desviación estándar del producto de las dos primeras medias muestrales") o sólo la desviación estándar en la distribución del producto de las dos variables independientes (que creo que es lo que hace tu cálculo del bosque).

0voto

wolfies Puntos 2399

Para su problema revisado:

Dada: $X$ y $Y$ son variables aleatorias independientes con diferentes tamaños de muestra, digamos $n$ y $m$ respectivamente.

La varianza de dos variables aleatorias independientes, en este caso, siendo las medias muestrales $\bar X$ y $\bar Y$ es:

$$ {\rm Var}(\bar X \space \bar Y) ={\rm Var}(\bar X){\rm Var}(\bar Y)+{\rm Var}(\bar X)(E(\bar Y))^2+{\rm Var}(\bar Y)(E(\bar X))^2$$

donde:

  • $E(\bar X) = \mu_X$
  • $E(\bar Y) = \mu_Y$
  • ${\rm Var}(\bar X) = \frac1n {\rm Var}(X)$
  • ${\rm Var}(\bar Y) = \frac1m {\rm Var}(Y)$

Eso es todo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X