5 votos

¿Qué significa decir que la distribución t proporciona un "ajuste" o "estimación" de una distribución normal?

He oído varias veces en clase que la distribución t nos permite modelizar los datos con mayor precisión cuando el tamaño de la muestra es pequeño o cuando no conocemos la varianza. Me pregunto qué se quiere decir con esto y por qué la distribución t se considera en cierto modo un "reajuste".

¿En qué consiste el reajuste de una distribución t? Tengo entendido que la distribución t se desarrolló originalmente para manejar tamaños de muestra pequeños (6 creo que en el artículo de Gossett), y que existe una noción de corregir para las colas. ¿Podría alguien arrojar luz sobre la corrección? Gracias.

5voto

mat_geek Puntos 1367

Si los datos se distribuyen normalmente, el estadístico de prueba con la desviación típica de la muestra en el denominador tendrá una distribución t con n-1 grados de libertad. Para n grandes, la distribución t es aproximadamente normal. Pero en muestras pequeñas será simétrica con colas más pesadas que la normal. El hecho de que las colas sean más pesadas que para la normal estándar podría considerarse como un ajuste de la normal en las colas.

1 votos

¿Podría decirme qué tienen las muestras pequeñas para que queramos tener colas más pesadas? Yo lo veo como una desproporción del peso de los valores atípicos (ahora los sucesos más extremos tienen una masa más pesada). Entonces, ¿es justo decir que, puesto que no tenemos demasiadas muestras, existe la posibilidad de que nuestra pequeña muestra esté sesgada y, por tanto, necesitamos tener más masa en los sucesos fortuitos para tener en cuenta los sucesos extremos?

2 votos

No se trata de querer colas pesadas. Lo que ocurre es que el estadístico de prueba con la desviación típica de la muestra sustituyendo a la desviación típica de la población tiene colas más gruesas debido a la incertidumbre adicional en el denominador debida a la estimación.

1voto

Alan Puntos 7273

Es convencional calcular la varianza de la muestra para que sea un estimador insesgado de la varianza de la población dividiendo por $n-1$ en lugar de $n$ .

Pero entonces la desviación típica de la muestra no es un estimador insesgado de la desviación típica de la población, y el recíproco de la desviación típica de la muestra está aún más sesgado como estimador del recíproco de la desviación típica de la población. En particular, las subestimaciones de la varianza harán que la estimación del recíproco de la desviación típica sea mucho más grande, y esto no se compensa totalmente con las sobreestimaciones de la varianza.

Dividiendo el valor de interés por la desviación típica de la población se obtendría una estadística de distribución normal.

Pero el $t$ divide el valor de interés por la estimación de la desviación típica de la muestra (es decir, multiplica por su recíproco). La posibilidad de que este resultado sea mucho mayor de lo que habría sido utilizando la desviación típica de la población ayuda a impulsar las colas más pesadas del $t$ y este tipo de distorsiones son más probables con muestras pequeñas. En cierto sentido, la $t$ puede considerarse un ajuste de la distribución normal para tener esto en cuenta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X