8 votos

¿Cuál es la distribución de los $(\overline{x}-\mu)/{\rm SE}(\overline{x})$ normal y Cuándo es $t$?

A la hora de estimar la media de una población, de dos distribuciones parecen ser útil, la distribución normal y la distribución t.

¿Es correcto decir que el $t=(\overline{x}-\mu)/{\rm SE}(\overline{x})$ sigue una distribución normal para la población en general (no sólo de una distribución normal), siempre y cuando los tamaños de las muestras son de tamaño significativo (por medio del teorema del límite central) ?

Y, ¿es correcto que t sigue una distribución t cuando el tamaño de la muestra es pequeño, pero, a continuación, la población sólo si la población está normalmente distribuida, debido a que el teorema central del límite no se aplica ?

Gracias !

14voto

Niall Puntos 51

Hay una sutil cuestión que no se menciona en la pregunta respecto a la estimación de la desviación estándar de $\overline{x}$'s de la distribución de muestreo.

Supongamos que tenemos una muestra de una población con una media de $\mu$ y la varianza $\sigma^2$. Al $\sigma^2$ es conocida, $${\rm SE}(\overline{x}) = \sigma/\sqrt{n}$$ is exactly the standard deviation of the sample mean. In practice, you usually don't know $\sigma^2$, so you instead plug in the sample variance $\hat\sigma$ to use $${\rm SE}(\overline{x}) = \hat\sigma/\sqrt{n}$$ to estimate the standard deviation of $\overline{x}$. This distinction is actually important - when the variance is unknown, this additional uncertainty must be incorporated into the hypothesis test. This is why, even when the sample is normally distributed, the test statistic has a $t$-distribution (which has longer tails) instead of a normal distribution when $\sigma$ es desconocido.

¿Es correcto decir que el $t=(\overline{x}−μ)/SE(\overline{x})$ sigue una distribución normal para la población en general (no sólo de una distribución normal), siempre y cuando los tamaños de las muestras son de tamaño significativo (por medio del teorema del límite central)

Esto es casi correcta. La población debe tener varianza finita (es decir, no tienen colas que son "demasiado largo") para que este sea el caso. Incluso cuando la población tiene una varianza finita, la distribución de la población puede tener un gran efecto en ¿cuánto tiempo hasta que la CLT "entra en acción". Para más corta cola de las distribuciones de esta convergencia es más rápida. Para la larga cola de las distribuciones se puede tomar un buen tiempo (por ejemplo, véase mi ejemplo aquí).

Tenga en cuenta que dado que estamos hablando de un "gran ejemplo" resultado aquí, esto es cierto independientemente de si o no usted sabe $\sigma$ desde $\hat \sigma$ más cerca de la verdad $\sigma$ como el tamaño de la muestra aumenta.

Y, ¿es correcto que t sigue una distribución t cuando el tamaño de la muestra es pequeño, pero, a continuación, la población sólo si la población está normalmente distribuida, debido a que el teorema central del límite no se aplica?

De nuevo, suponiendo que estamos en el "$\sigma$ es desconocido" mundo, $t$ sólo sigue un $t$-distribución de la muestra se distribuye normalmente, que creo que es lo que estás diciendo aquí. Relacionado con lo que dije al principio, si $\sigma$ es conocido, $t$ (exacto) de la distribución normal si la muestra se distribuye normalmente.

Para resumir:

  • Si $\sigma$ es conocido, y la población está normalmente distribuida: $t$ tiene una distribución normal.

  • Si $\sigma$ es desconocido, y la población está normalmente distribuida: $t$ $t$- distribución.

  • Si la población no está normalmente distribuido, pero cumple con los requisitos de regularidad de la CLT: $t$ tiene aproximadamente una distribución normal si o no $\sigma$ es conocido. Es decir, la distribución de $t$ converge a una distribución normal, como el tamaño de la muestra aumenta.

-2voto

mat_geek Puntos 1367

No sería el error estándar de la media relacionados con la distribución de chi cuadrada no la normal cuando froma normal distribución de muestreo. Es la media de la muestra normalizada por el error samplestandard que es aproximadamente normal por el CLT tiene un t distribución cuando la media verdadera es cero y los datos se distribuyen normalmente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X