(Voy a publicar mi respuesta a esto, pero no dude en enviar su propio!)
Distribución t de Student, o de la distribución T, se introdujo en 1908 por William Sealey Gossett escrito bajo el seudónimo de "Student".
¿Qué es y para qué sirve?
(Voy a publicar mi respuesta a esto, pero no dude en enviar su propio!)
Distribución t de Student, o de la distribución T, se introdujo en 1908 por William Sealey Gossett escrito bajo el seudónimo de "Student".
¿Qué es y para qué sirve?
Deje $X_1,\ldots,X_n$ ser independientes idénticamente distribuidas variables aleatorias que siguen una distribución normal con valor esperado $\mu$ y la varianza $\sigma^2$. Piense en ellos como una muestra aleatoria de una distribución normal de la población, cuyo valor esperado y la varianza son desconocidos y deben ser estimados con base en esta muestra.
Entonces la variable aleatoria $$ \frac{\bar X-\mu}{\sigma/\sqrt{n}},\qquad\text{donde } \bar X = \frac{X_1+\cdots+X_n}{n} $$ se distribuye normalmente con el valor esperado $0$ y la varianza $1$. Así tenemos $$ \Pr\left(-1.96<\frac{\bar X-\mu}{\sigma/\sqrt{n}}<1.96\right) = 0.95, $$ así que tenemos una $95\%$ intervalo de confianza para $\mu$, con extremos de $\bar X\pm1.96\dfrac{\sigma}{\sqrt{n}}$, siempre sabemos el valor de $\sigma$. Pero, por supuesto, en la práctica no sabemos $\sigma$. Podemos calcular los $\sigma$ mediante el uso de $$ S = \sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2}, $$ y es improbable que eso es muy diferente de $\sigma$ si $n$ es grande.
Pero lo que si $n$ es pequeña? A continuación, piensa en $$ T=\frac{\bar{X}-\mu}{S/\sqrt{n}}. $$ La distribución de esta variable aleatoria es aproximadamente normal, si $n$ es grande. La distribución exacta, sin importar el valor de $n\ge2$, es la distribución t de Student con $n-1$ grados de libertad. Dado $n$, uno puede encontrar por los algoritmos estándar de un número $A$ tal que $\Pr(-A<T<A)=0.95$ (muchos paquetes de software dará a dichos números, y se pueden encontrar en las tablas en las espaldas de los libros, y en los días de antaño, hubo volúmenes que contienen extensas tablas). Esto nos da un $95\%$ intervalo de confianza para $\mu$ con extremos de $\bar X\pm A\dfrac{S}{\sqrt{n}}$. Este número $A$ es mayor que $1.96$ debido a la incertidumbre adicional de no conocer a $\sigma$. El menor $n$, mayor es $A$ es. Y $A\downarrow1.96$$n\to\infty$.
Con el fin de que todos los de este trabajo, es necesario que la distribución de $T$ no dependen $\mu$ o $\sigma$. En efecto $\mu$ cancela con la sustracción en el numerador, y $\sigma$ cancela con la división.
Oh, eso es mucho más de lo que yo iba a decir: $T$ es la distribución de $${\bar x - \mu \over s / \sqrt{n}}$$ donde $x$ es una variable normalmente distribuida con una media de $\mu$, e $\bar x$ $s$ la media muestral y la desviación estándar (resp.) de una muestra aleatoria de tamaño $n$. (Estoy asumiendo todo el mundo entiende que una muestra aleatoria cumple con las mismas condiciones que Michael Hardy $X_1,\dots,X_n$.)
Puedo agregar dos cosas: Gossett trabajado para el Guiness, que no permiten a sus investigadores a publicar, por lo que recurrieron a la seudónimo. La distribución t se desarrolló en El Error Probable de la Media, Biometrika, 6(1), (Mar. 1908) 1-25.
I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.