Me gustaría probar$H_{0} :$ $\mu_{1} = \mu_{2}, \ \sigma_{1}^{2} = \sigma_{2}^{2}$ vs$H_{0} :$ $\mu_{1} \neq \mu_{2}, \ \sigma_{1}^{2} \neq \sigma_{2}^{2}$
¿Hay una estadística de prueba que me permita detectar tanto las diferencias en la media y las diferencias en la varianza? ¿Hay una manera que posiblemente podría combinar el$F$ -$test$ y el$t$ -$test$ para derivar esta estadística de prueba? Estoy asumiendo que la población tiene una distribución normal, pero ¿y si no lo era?
Estoy muy atrapado por lo que cualquier ayuda sería muy apreciada.
Respuesta
¿Demasiados anuncios?Este problema de la detección de una diferencia de dos distribuciones Normales basadas en muestras aleatorias independientes de cada uno de ellos fue resuelto asintóticamente por Pearson y Neymar en 1930 mediante la prueba de razón de verosimilitud. (Específicamente, la hipótesis alternativa es que la $\mu_1\ne\mu_2$ o $\sigma_1^2\ne\sigma_2^2.$ Bajo la hipótesis nula, el cociente de probabilidad estadística es asintóticamente uniforme como el tamaño de ambas muestras crecer grande). En 2012, Zhang, Xu, y Chen proporcionó una expresión manejable para la CDF de la razón de verosimilitud estadístico: es una integral doble que calcular numéricamente.
Para otros paramétrico de familias de distribuciones, el problema puede, en principio, puede ser resuelto con técnicas similares.
Deje que las dos muestras de ser $(x_i|1\le i\le n)$ Normal$(\mu_1, \sigma_1^2)$ distribución y $(y_j|1\le j\le m)$ Normal$(\mu_2, \sigma_2^2)$ distribución. El cociente de probabilidad estadística es
$$\lambda_{n,m} = \frac{s_x^{n/2} s_y^{m/2}}{s^{(n+m)/2}}$$
donde
$$s_x = \sum_{i=1}^n(x_i-\bar{x})^2/n,$$
$$s_y = \sum_{j=1}^m(y_j - \bar{y})^2/m,$$
$$s = \left(\sum_{i=1}^n(x_i-u)^2 + \sum_{j=1}^m(y_j-u)^2\right)/(n+m)$$
y $\bar{x}, \bar{y},$ $u$ son la muestra de medios de la $x_i,$ $y_j,$ y el combinado de la muestra, respectivamente. La CDF de $\lambda_{n,m}$ es
$$F_{n,m}(\lambda) = 1 - C\iint_D\frac{w_1^{(n-1)/2}w_2^{(m-1)/2}}{\sqrt{1-w_1-w_2}}\frac{dw_1}{w_1}\frac{dw_2}{w_2}$$
con
$$C = \frac{\Gamma(\frac{n+m-1}{2})}{\Gamma(\frac{n-1}{2})\Gamma(\frac{m-1}{2})\Gamma(\frac{1}{2})},$$
$$D = \left\{(w_1,w_2)|w_1\gt 0, w_2\gt 0, w_1+w_2\lt 1, \frac{(n+m)^{(n+m)/2}}{n^{n/2}m^{m/2}}w_1^{n/2}w_2^{m/2}\gt \lambda\right\}.$$
La trama de la CDF de la razón de verosimilitud estadístico $\lambda_{2,2}$. La curva se calcula mediante integración numérica en los puntos de $\lambda=0, 1/20, 2/20, \ldots, 1$, mientras que los puntos son el resultado de una simulación de $10,000$ pares de muestras.
Referencias
Lingyun Zhang, Xinzhong Xu, y Gemai Chen. La Exacta de la Prueba de razón de Verosimilitud para la Igualdad de las Dos Normales de la población. El Estadístico Americano, De Agosto De 2012, Vol. 66, Nº 3, pp 180-184.
E. S. Pearson y J. Neyman, Sobre el Problema de las Dos Muestras (1930). Publicado en la Articulación de Documentos Estadísticos (1967), eds. J. Neyman y E. S. Pearson, Cambridge University Press, pp 99-115.