7 votos

¿Es posible combinar la prueba F y t-test para comprobar las diferencias tanto en la varianza y la media?

Me gustaría probar$H_{0} :$ $\mu_{1} = \mu_{2}, \ \sigma_{1}^{2} = \sigma_{2}^{2}$ vs$H_{0} :$ $\mu_{1} \neq \mu_{2}, \ \sigma_{1}^{2} \neq \sigma_{2}^{2}$

¿Hay una estadística de prueba que me permita detectar tanto las diferencias en la media y las diferencias en la varianza? ¿Hay una manera que posiblemente podría combinar el$F$ -$test$ y el$t$ -$test$ para derivar esta estadística de prueba? Estoy asumiendo que la población tiene una distribución normal, pero ¿y si no lo era?

Estoy muy atrapado por lo que cualquier ayuda sería muy apreciada.

11voto

jldugger Puntos 7490

Este problema de la detección de una diferencia de dos distribuciones Normales basadas en muestras aleatorias independientes de cada uno de ellos fue resuelto asintóticamente por Pearson y Neymar en 1930 mediante la prueba de razón de verosimilitud. (Específicamente, la hipótesis alternativa es que la $\mu_1\ne\mu_2$ o $\sigma_1^2\ne\sigma_2^2.$ Bajo la hipótesis nula, el cociente de probabilidad estadística es asintóticamente uniforme como el tamaño de ambas muestras crecer grande). En 2012, Zhang, Xu, y Chen proporcionó una expresión manejable para la CDF de la razón de verosimilitud estadístico: es una integral doble que calcular numéricamente.

Para otros paramétrico de familias de distribuciones, el problema puede, en principio, puede ser resuelto con técnicas similares.


Deje que las dos muestras de ser $(x_i|1\le i\le n)$ Normal$(\mu_1, \sigma_1^2)$ distribución y $(y_j|1\le j\le m)$ Normal$(\mu_2, \sigma_2^2)$ distribución. El cociente de probabilidad estadística es

$$\lambda_{n,m} = \frac{s_x^{n/2} s_y^{m/2}}{s^{(n+m)/2}}$$

donde

$$s_x = \sum_{i=1}^n(x_i-\bar{x})^2/n,$$

$$s_y = \sum_{j=1}^m(y_j - \bar{y})^2/m,$$

$$s = \left(\sum_{i=1}^n(x_i-u)^2 + \sum_{j=1}^m(y_j-u)^2\right)/(n+m)$$

y $\bar{x}, \bar{y},$ $u$ son la muestra de medios de la $x_i,$ $y_j,$ y el combinado de la muestra, respectivamente. La CDF de $\lambda_{n,m}$ es

$$F_{n,m}(\lambda) = 1 - C\iint_D\frac{w_1^{(n-1)/2}w_2^{(m-1)/2}}{\sqrt{1-w_1-w_2}}\frac{dw_1}{w_1}\frac{dw_2}{w_2}$$

con

$$C = \frac{\Gamma(\frac{n+m-1}{2})}{\Gamma(\frac{n-1}{2})\Gamma(\frac{m-1}{2})\Gamma(\frac{1}{2})},$$

$$D = \left\{(w_1,w_2)|w_1\gt 0, w_2\gt 0, w_1+w_2\lt 1, \frac{(n+m)^{(n+m)/2}}{n^{n/2}m^{m/2}}w_1^{n/2}w_2^{m/2}\gt \lambda\right\}.$$

Figure

La trama de la CDF de la razón de verosimilitud estadístico $\lambda_{2,2}$. La curva se calcula mediante integración numérica en los puntos de $\lambda=0, 1/20, 2/20, \ldots, 1$, mientras que los puntos son el resultado de una simulación de $10,000$ pares de muestras.


Referencias

Lingyun Zhang, Xinzhong Xu, y Gemai Chen. La Exacta de la Prueba de razón de Verosimilitud para la Igualdad de las Dos Normales de la población. El Estadístico Americano, De Agosto De 2012, Vol. 66, Nº 3, pp 180-184.

E. S. Pearson y J. Neyman, Sobre el Problema de las Dos Muestras (1930). Publicado en la Articulación de Documentos Estadísticos (1967), eds. J. Neyman y E. S. Pearson, Cambridge University Press, pp 99-115.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X