4 votos

¿Por qué el concepto de hipótesis nula está asociado con la distribución t de los estudiantes?

Hay docenas de distribuciones de probabilidad continuas como Gaussian (normal), Variance-gamma, Holtsmark, etc. Sin embargo, el concepto de la hipótesis Null está básicamente asociado con la distribución t de Student. Cualquier idea de por qué. Tanques

12voto

AdamSane Puntos 1825

Hay una docena de distribuciones de probabilidad continua

Hay un número infinito de distribuciones de probabilidad continua. Los que se han discutido lo suficiente como para ser llamado y se incluyen en el espacio de un par de páginas son, sin embargo, suficiente para llenar varios libros (y de hecho lo hacen - véase, por ejemplo, de los muchos libros por Johnson, Kotz y otros co-autores).

Sin embargo, el concepto de la hipótesis Nula se asocia básicamente con la distribución t de Student.

Este no es el caso. Si usted echa un vistazo a la escritura de Neyman y Pearson o la de Fisher en la prueba de hipótesis (los dos enfoques principales para la prueba de hipótesis), la distribución t no es necesario ni en cualquier forma una parte importante de cualquiera.

Tampoco es "el más utilizado para el estudio de la prueba de hipótesis" (si estás estudiando la teoría de la prueba de hipótesis se podría mirar solamente de paso - tal vez como parte de un capítulo, por ejemplo), pero es uno de los primeros ejemplos de pruebas de hipótesis muchos estudiantes aprenden acerca de.

Hay cientos de pruebas de hipótesis que se utilizan (por lo menos; más probablemente miles de dólares) y los nuevos son bastante fácil de construir. Algunas situaciones, usted puede haber oído hablar de incluir: pruebas de independencia en tablas de contingencia, pruebas de multinomial de la bondad de ajuste, pruebas de igualdad de medios en una forma de análisis de varianza, prueba de igualdad de la varianza, rango basado en pruebas de ubicación o de omnibus pruebas de la distribución de la bondad de ajuste. Ninguno de estos es probable que implican t-distribuciones (y hay muchos, muchos más de los que usted probablemente no ha oído hablar).

Me han dicho que el chi-cuadrado de distribución y la distribución normal son mucho más fundamentales para la prueba de hipótesis (en particular, como aproximaciones en muestras grandes), pero incluso allí, pruebas de hipótesis, que seguiría existiendo, incluso si no se producen en absoluto.

Si usted mira el lema de Neyman-Pearson, Fisher prueba exacta/permutación/aleatorización de la prueba, y en bootstrap pruebas, que en su lugar podría preguntarse si la distribución t podría realmente llegar todo lo que mucho.

Ahora un importante subconjunto de pruebas que se realizan en aplicaciones que implican la distribución t, pero que de ninguna manera una propiedad esencial de la hipótesis nula.

Se produce por una muy simple razón: se trata de seguridad cuando se trata con la inferencia (pruebas e intervalos) acerca de la muestra de medios de distribución normal de la población de las cantidades (y algunas otras circunstancias) bajo el caso en que la varianza de la población es desconocida.

En consecuencia, la distribución t (a través de una muestra de la/pruebas t pareadas, two sample t-test, pruebas de solo coeficientes de regresión y pruebas de 0 correlación) puede ser la mayor parte de su exposición a las pruebas de hipótesis, pero que no es una abrumadora fracción de la prueba de hipótesis más general.

6voto

Aaron Puntos 36

...el concepto de que la hipótesis nula es básicamente asociados con la distribución t de Student.

De verdad que no. La hipótesis nula se asocia con un correspondiente nula distribución, el cual varía dependiendo del modelo y de la estadística de prueba. En la hipótesis clásica de las pruebas desconocidas lineal de coeficientes o los valores de la media, que generalmente se utiliza un estadístico de prueba que es algún tipo de studentised media del estimador, y esto conduce a un valor nulo de distribución que es el de la T de Student la distribución. En otras pruebas, se obtiene una diferente nula distribución. Parece que se están asociando los dos conceptos más fuerte de lo que en realidad están asociados, y luego se preguntan por qué es así.

5voto

Steve Puntos 212

Cuando queremos poner a prueba una hipótesis, tenemos un estadístico de prueba con una distribución de probabilidad conocida. Esto normalmente implica la normalización de los datos. Por ejemplo, si obtenemos una muestra aleatoria $X_1, \dots, X_n$ , con una media de $\mu$ y la varianza $\sigma^2$, y los datos se supone que se distribuye normalmente. Entonces podemos estandarizar como

$$Z_n = \frac{\bar{X}_n-\mu}{\sigma/\sqrt{n}}$$

$Z_n$ tiene un nivel normal de $N(0,1)$ de la distribución, y por lo que los valores pueden ser utilizados para probar si nuestra hipótesis de decir $\mu$ es cierto. Incluso si los datos no es normal, el teorema del límite central dice que será asintóticamente siempre que la varianza existe (es decir. $EX^2 < \infty$).

El problema es que, mientras se están normalmente interesados en la media de $\mu$, la varianza $\sigma^2$ es también desconocido. Esto se llama una molestia parámetro. Por lo tanto necesitamos para aproximar $Z_n$ sustituyendo en una estimación de $\sigma^2$, que es la varianza de la muestra

$$s^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X}_n)^2$$

Pero, al hacerlo, tenemos una nueva prueba estadística de

$$T_n = \frac{\bar{X}_n-\mu_0}{s/\sqrt{n}}$$

Esto resulta $t$ distribución $n-1$ grados de libertad si la hipótesis nula es verdadera (es decir. si la verdadera media se utiliza). Así, aunque el $\sigma^2$ es desconocida, se ha obtenido un estadístico de prueba con un conocido de distribución para realizar inferencias.

La razón por la que sigue una $t$ distribución es que lo anterior puede ser expresado como una variable aleatoria normal dividida por la raíz cuadrada de un independiente chisquared variable aleatoria, lo que da un $t$ distribución.

1voto

Adam Puntos 25

No, pero probablemente no lo parezca a un no-estadístico que está aprendiendo mientras tratando de hacer algunos conceptos básicos de la inferencia en el contexto de una clase de ciencias o algo por el estilo. Debido a que el tipo de cosas en los experimentos de ciencias desea hacer inferencia/hyp pruebas en tener las características de un t-test: la varianza no es conocido, las muestras son pequeñas, y de que están tratando con algo que es continuo en la naturaleza. Un stats estudiante es casi seguro que se presentó a una prueba z en primer lugar, a través de la población proporción de la prueba.

El truco es darse cuenta de que la transición de la z a la prueba t para la media de población de la inferencia y la prueba de hipótesis proviene de la adición de otro parámetro que debe ser estimado -- la varianza, y en la gran mayoría de situaciones a las que te vas a encontrar la varianza de la población no es conocida.

Me imagino que la mayoría de las personas que asocian a la prueba de hipótesis con la prueba de la T de hacerlo porque es por lejos el más común encontrado en las ciencias y las humanidades, al menos en los niveles inferiores.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X