18 votos

Intuición matemática y Naturales de la Motivación Detrás de t-Student la Distribución

Estoy tratando de entender con matemáticos básicos de fondo de cómo la $t$-Estudiante de distribución es una forma "natural" $pdf$ a definir. Así que espero que esta no es demasiado general una pregunta, pero teniendo en cuenta que el $t$-distribución es utilizado por casi todo el mundo, me siento como sería genial tener una entrada en el sitio haciendo de la matemática fundamentos accesibles a la gente en ciencias aplicadas (los que se acaba de enseñar cómo utilizar las tablas al final del libro :-) ). Algo más aplicado de forma mucho más sofisticada puestos, o los enormes Biometrika papel por RA Fisher.

Aquí está mi entendimiento con cabos sueltos:

Si $X_1, \ldots, X_n$ son iid observaciones $\sim N(\mu,\sigma^2)$,

$\large\frac{\bar{X}\,-\,\mu}{\sigma/\sqrt{n}} \sim N(0,1)$. Y $\large\frac{\bar{X}\,-\,\mu}{\sigma/\sqrt{n}}$ es la fórmula de la Z-estadístico.

Si el $X_1,\ldots,X_n$ no están distribuidos normalmente, la expresión se tienden a $\sim N(0,1)$$n\mapsto\infty$, la base para el teorema del límite central (CLT).

[Tenga en cuenta que esta declaración de apertura es ahora correcto después de reflexionar @Ian y @Michael Hardy comentarios a la original en referencia a la CLT.]

Si la desviación estándar de la población, $\sigma$, se desconoce podemos reemplazarlo por el de estimación basada en una muestra, $S$, pero entonces la expresión (one-sample t-test de estadística) seguirá una $t$distribución de:

$\displaystyle \frac{\bar{X}\,-\,\mu}{S/\sqrt{n}}\sim t_{n-1}$ $S=\sqrt{\frac{\sum(X_i-\bar X)^2}{n-1}}$ (de Bessel de la corrección).

$$ \frac{\bar{X}\,-\,\mu}{S/\sqrt{n}} = \frac{\bar{X}\,-\,\mu}{\frac{\sigma}{\sqrt{n}}} \frac{1}{\frac{S}{\sigma}}= Z\,\frac{1}{\frac{S}{\sigma}} = \frac{Z}{\sqrt{\frac{\sum(X_i-\bar X)^2}{(n-1)\,\sigma^2}}} \sim\frac{Z}{\sqrt{\frac{\chi_{n-1}^2}{n-1}}} \sim t_{n-1}\small \tag 1$$

Cómo se hizo el test de la chi cuadrado ($\chi^2$) hicieron su entrada en el $pdf$? Es la distribución en la que los modelos de $X^2$$X\sim N(0,1)$:

Digamos que $X \sim N(0,1)$ y $Y=X^2$ y encontrar la densidad de $Y$ mediante el uso de la $cdf$ método de:

$p(Y \leq y) = p(X^2 \leq y)= p(-\sqrt{y} \leq x \leq \sqrt{y})$. El problema es que no podemos integrar en cerca de la forma de la densidad de la distribución normal. Pero podemos expresar:

$$ F_X(y) = F_X(\sqrt{y})- F_X(-\sqrt[]{y}).$$ De tomar la derivada:

$$ f_X(y)= F_X'(\sqrt{y})\,\frac{1}{2\sqrt{y}}+ F_X'(\sqrt {y})\,\frac{1}{2\sqrt{y}}.$$

Ya que los valores de la normal de $pdf$ son simétricos:

$\gran f_X(y)= F_X'(\sqrt{y})\,\frac{1}{\sqrt{y}}$. Equating this to the $pdf$ of the normal (now the $x$ in the $pdf$ will be $\sqrt{y}$ to be plugged into the $e^{-\frac{x^2}{2}}$ part of the normal $pdf$); and remembering to in include $\frac{1}{\sqrt{y}}$ al final:

$$ f_X(y)= F_X'(\sqrt[]{y})\,\frac{1}{\sqrt[]{y}}= \frac{1}{\sqrt{2\pi}}\,e^{-\frac{y}{2}}\, \frac{1}{\sqrt[]{y}}=\frac{1}{\sqrt{2\pi}}\,e^{-\frac{y}{2}}\, y^{\frac{1}{2}- 1}$$

Comparar con el pdf de la chi cuadrado:

$$ f_X(x)= \frac{1}{2^{\nu/2}\Gamma(\frac{\nu}{2})}e^{\frac{-x}{2}}x^{\frac{\nu}{2}-1}$$

Desde $\Gamma(1/2)=\sqrt{\pi}$ $1$ df, que han derivado exactamente el $pdf$ de la chi cuadrado.

Y en el caso de la $t$-distribución chi-cuadrado es adecuado para el modelo de la suma de los cuadrados de las normales ($\sum(X_i-\bar X)^2$ en (1)), un conocido de la propiedad derivados de aquí normalmente con $n$ grados de libertad, pero ¿por qué es $n\,-\,1$ aquí?

No sé cómo explicar la $\sigma^2$ $\frac{\sum(X_i-\bar X)^2}{\sigma^2}$ en la ecuación (1) se convierte en "absorbido" en el $\chi_{n-1}^2$ parte de la $t-Student's$ $pdf$.

Así que todo se reduce a la comprensión de por qué

$$\frac 1 {\sigma^2} \Big((X_1-\bar X)^2 + \cdots + (X_n - \bar X)^2 \Big) \sim \chi^2_{n-1}.$$ Después de que la derivación de los pdf es que no desalentadora.

PS: La respuesta de abajo se convierte en claro después de leer esta entrada de la Wikipedia.

6voto

Michael Hardy Puntos 128804

Usted escribió "que es una expresión del teorema del límite central". Eso no es correcto. Comenzó con una distribución normal. El teorema del límite central dice que si empiezas con cualquier distribución con varianza finita, no se supone que para ser normal, la suma de (i).yo.d. las copias serán casi normalmente distribuida.

Su principal pregunta parece ser: ¿cómo funciona el test de la chi-cuadrado de distribución participar?

Ha $X_1,\ldots,X_n\sim\text{ i.i.d. } N(\mu,\sigma^2)$$\bar X = (X_1+\cdots+X_n)/n$. La propuesta es, entonces, $$ \frac 1 {\sigma^2} \Big((X_1-\bar X)^2 + \cdots + (X_n - \bar X)^2 \) \sim \chi^2_{n-1}. $$

Las variables aleatorias $(X_i - \bar X)/\sigma$ son no independientes, pero tienen covarianza $-1/n$ entre dos cualesquiera de ellos.

La desviación estándar de cada uno de ellos es el no $1$, pero $\sqrt{(n-1)/n\,{}}$.

Hay no $n-1$ de ellos, sino $n$.

Pero la distribución de la suma de sus cuadrados es afirmado ser el mismo como si fuera un (1) independientes, y (2) cada uno tiene una desviación estándar $1$ (3) no se $n-1$ de ellos.

Esto puede ser entendido de manera geométrica, de la siguiente manera: La asignación de $(X_1,\ldots,X_n)\mapsto (\bar X, \ldots, \bar X)$ es la proyección ortogonal sobre un $1$-dimensiones subespacio de $\mathbb R^n$, y es complementario de asignación de $(X_1-\bar X,\ldots,X_n-\bar X)$ es la proyección ortogonal sobre el $(n-1)$-dimensiones subespacio definido por la restricción de que la suma de las coordenadas es $0$. Observe que la última proyección se toma la media de vectores $(\mu,\ldots,\mu)$$(0,\ldots,0)$.

La distribución de $(X_1,\ldots,X_n)$ es esféricamente simétrica alrededor de la media del vector, ya que es $$ \text{constante}\cdot \exp\left( -\frac 1 2 \sum_{i=1}^n\left( \frac{x_i-\mu} \sigma \right)^2 \right)\,dx_1\,\cdots\,dx_n. $$

La distribución de una proyección ortogonal de este vector aleatorio, que la proyección se lleva a la media del vector a $0$, es esféricamente simétrico con respecto al $0$ en el menor espacio tridimensional en el que uno de los proyectos. Así que vamos a $(U_1,\ldots,U_{n-1})$ ser las coordenadas de $(X_1-\bar X,\ldots, X_n-\bar X)$ en relación a algunos ortonormales base de ese $(n-1)$-dimensional en el subespacio, y entonces usted tiene $$ (X_1-\bar X)^2 + \cdots + (X_n-\bar X)^2 = U_1^2 + \cdots + U_{n-1}^2 \tag 1 $$ y $$ U_2,\ldots,U_n\sim\text{ i.yo.d. }N(0,\sigma^2). $$

Por lo tanto, $(1)$ se distribuye de la $\sigma^2\chi^2_{n-1}$.

También, observe que $\bar X$ es realmente independiente de $(X_1 - \bar X,\ldots,X_n-\bar X)$. Que se sigue del hecho de que son conjuntamente distribuidas normalmente y $\operatorname{cov}(\bar X, X_i-\bar X)=0$. Que también es necesaria en orden a la conclusión de que usted obtener un $t$-distribución.

PS: se puede hacer esto con matrices: Hay un $n\times n$ matriz $Q$ para los que $$ QX=P\begin{bmatrix} X_1 \\ \vdots \\ X_n \end{bmatrix} = \begin{bmatrix} X_1 - \bar X \\ \vdots \\ X_n - \bar X \end{bmatrix}. $$ Satisface $Q^2=Q^T=Q$. Y $P=I-Q$ satisface $P^2=P^T=P$, e $QP=PQ=0$. Entonces tenemos $$ \operatorname{cov}(PX, QX) = P\Big(\operatorname{cov}(X,X)\Big) Q^T = P(\sigma^2 I)Q^T = \sigma^2 PQ = 0. $$ y $$ QX \sim N(0,\sigma^2 P\Big(\sigma^2 I\Big) Q^T) = N(0,\sigma^2 P). $$ (Llegamos $0$ como media de escuchar porque $Q$ veces la media del vector es $0$.) Nuestro denominador en la $t$-estadística es, a continuación,$\|QX\|/\sqrt n$.

PS: Aquí hay algo diferente en la manera de expresarlo. El vector $(X_1,\ldots,X_n)$ valor esperado $(\mu,\ldots,\mu)$. Deje $(U_1,\ldots,U_{n-1},U_n)$ ser las coordenadas del punto de $(X_1,\ldots,X_n)$ en un sistema de coordenadas diferente: El $n$th componente $U_n$ es la posición de un eje que apunta desde $(0,\ldots,0)$ en la dirección de $(\mu,\ldots,\mu)$, y dejar que el otro $U_k$ $k=1,\ldots,n-1$ son componentes en las direcciones en ángulos rectos a que uno. En el primer sistema de coordenadas en la proyección de $(X_1,\ldots,X_n)$ sobre el espacio en el que la suma de los componentes es$0$$(X_1-\bar X,\ldots,X_n-\bar X)$. En el segundo sistema de coordenadas de la proyección de $(U_1,\ldots,U_{n-1},U_n)$ en ese mismo espacio es $(U_1,\ldots,U_{n-1},0)$. La transformación de $(\mu,\ldots,\mu)$ en el segundo sistema de coordenadas, obtenemos $(0,\ldots,0,\mu\sqrt n)$, y la proyección de que en la citada subespacio es $(0,\ldots,0,0)$. Por lo tanto $(X_1-\bar X)^2+\cdots+(X_n-\bar X)^2 = U_1^2+\cdots+U_{n-1}^2$$U_1,\ldots,U_{n-1}\sim\text{ i.i.d. } N(0,\sigma^2)$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X