Estoy tratando de entender con matemáticos básicos de fondo de cómo la $t$-Estudiante de distribución es una forma "natural" $pdf$ a definir. Así que espero que esta no es demasiado general una pregunta, pero teniendo en cuenta que el $t$-distribución es utilizado por casi todo el mundo, me siento como sería genial tener una entrada en el sitio haciendo de la matemática fundamentos accesibles a la gente en ciencias aplicadas (los que se acaba de enseñar cómo utilizar las tablas al final del libro :-) ). Algo más aplicado de forma mucho más sofisticada puestos, o los enormes Biometrika papel por RA Fisher.
Aquí está mi entendimiento con cabos sueltos:
Si $X_1, \ldots, X_n$ son iid observaciones $\sim N(\mu,\sigma^2)$,
$\large\frac{\bar{X}\,-\,\mu}{\sigma/\sqrt{n}} \sim N(0,1)$. Y $\large\frac{\bar{X}\,-\,\mu}{\sigma/\sqrt{n}}$ es la fórmula de la Z-estadístico.
Si el $X_1,\ldots,X_n$ no están distribuidos normalmente, la expresión se tienden a $\sim N(0,1)$$n\mapsto\infty$, la base para el teorema del límite central (CLT).
[Tenga en cuenta que esta declaración de apertura es ahora correcto después de reflexionar @Ian y @Michael Hardy comentarios a la original en referencia a la CLT.]
Si la desviación estándar de la población, $\sigma$, se desconoce podemos reemplazarlo por el de estimación basada en una muestra, $S$, pero entonces la expresión (one-sample t-test de estadística) seguirá una $t$distribución de:
$\displaystyle \frac{\bar{X}\,-\,\mu}{S/\sqrt{n}}\sim t_{n-1}$ $S=\sqrt{\frac{\sum(X_i-\bar X)^2}{n-1}}$ (de Bessel de la corrección).
$$ \frac{\bar{X}\,-\,\mu}{S/\sqrt{n}} = \frac{\bar{X}\,-\,\mu}{\frac{\sigma}{\sqrt{n}}} \frac{1}{\frac{S}{\sigma}}= Z\,\frac{1}{\frac{S}{\sigma}} = \frac{Z}{\sqrt{\frac{\sum(X_i-\bar X)^2}{(n-1)\,\sigma^2}}} \sim\frac{Z}{\sqrt{\frac{\chi_{n-1}^2}{n-1}}} \sim t_{n-1}\small \tag 1$$
Cómo se hizo el test de la chi cuadrado ($\chi^2$) hicieron su entrada en el $pdf$? Es la distribución en la que los modelos de $X^2$$X\sim N(0,1)$:
Digamos que $X \sim N(0,1)$ y $Y=X^2$ y encontrar la densidad de $Y$ mediante el uso de la $cdf$ método de:
$p(Y \leq y) = p(X^2 \leq y)= p(-\sqrt{y} \leq x \leq \sqrt{y})$. El problema es que no podemos integrar en cerca de la forma de la densidad de la distribución normal. Pero podemos expresar:
$$ F_X(y) = F_X(\sqrt{y})- F_X(-\sqrt[]{y}).$$ De tomar la derivada:
$$ f_X(y)= F_X'(\sqrt{y})\,\frac{1}{2\sqrt{y}}+ F_X'(\sqrt {y})\,\frac{1}{2\sqrt{y}}.$$
Ya que los valores de la normal de $pdf$ son simétricos:
$\gran f_X(y)= F_X'(\sqrt{y})\,\frac{1}{\sqrt{y}}$. Equating this to the $pdf$ of the normal (now the $x$ in the $pdf$ will be $\sqrt{y}$ to be plugged into the $e^{-\frac{x^2}{2}}$ part of the normal $pdf$); and remembering to in include $\frac{1}{\sqrt{y}}$ al final:
$$ f_X(y)= F_X'(\sqrt[]{y})\,\frac{1}{\sqrt[]{y}}= \frac{1}{\sqrt{2\pi}}\,e^{-\frac{y}{2}}\, \frac{1}{\sqrt[]{y}}=\frac{1}{\sqrt{2\pi}}\,e^{-\frac{y}{2}}\, y^{\frac{1}{2}- 1}$$
Comparar con el pdf de la chi cuadrado:
$$ f_X(x)= \frac{1}{2^{\nu/2}\Gamma(\frac{\nu}{2})}e^{\frac{-x}{2}}x^{\frac{\nu}{2}-1}$$
Desde $\Gamma(1/2)=\sqrt{\pi}$ $1$ df, que han derivado exactamente el $pdf$ de la chi cuadrado.
Y en el caso de la $t$-distribución chi-cuadrado es adecuado para el modelo de la suma de los cuadrados de las normales ($\sum(X_i-\bar X)^2$ en (1)), un conocido de la propiedad derivados de aquí normalmente con $n$ grados de libertad, pero ¿por qué es $n\,-\,1$ aquí?
No sé cómo explicar la $\sigma^2$ $\frac{\sum(X_i-\bar X)^2}{\sigma^2}$ en la ecuación (1) se convierte en "absorbido" en el $\chi_{n-1}^2$ parte de la $t-Student's$ $pdf$.
Así que todo se reduce a la comprensión de por qué
$$\frac 1 {\sigma^2} \Big((X_1-\bar X)^2 + \cdots + (X_n - \bar X)^2 \Big) \sim \chi^2_{n-1}.$$ Después de que la derivación de los pdf es que no desalentadora.
PS: La respuesta de abajo se convierte en claro después de leer esta entrada de la Wikipedia.