Una cuenta en el servidor es más caro que el de una cuenta en el servidor B. sin Embargo, Un servidor es más rápido. A ver si es mejor ir con el más rápido pero más caro servidor, un gerente necesita saber cuánto más rápido es . Un ordenador determinado algoritmo es ejecutado 20 veces en el servidor y 30 veces en el servidor B, con los siguientes resultados,
Server A Server B Sample means 6.7 min 7.5 min Sample std. dev. 0.6 min 1.2 min
Un 95% de intervalo de confianza para la diferencia de $\mu_{1} - \mu_{2}$ entre la media de los tiempos de ejecución en el servidor a y el servidor B [-1.4,-0.2] . Hay una diferencia significativa entre los dos servidores?
(a) Utilizar el intervalo de confianza de arriba para realizar una prueba de dos caras en el 1% de nivel de significación.
(b) Calcular un valor de p de la prueba de dos caras (una).
(c) Es Un servidor muy rápido? ¿Qué tan fuerte es la evidencia? Formular el adecuado hipótesis y alternativas y calcular el correspondiente p-valor.
Respuestas
¿Demasiados anuncios?Instalación: se supone que ambas muestras $$ \text{Servidor:}\quad x_{11},\ldots,x_{1n_1},\\ \text{Servidor B:}\quad x_{21},\ldots,x_{2n_2}. $$ son yo.yo.d. observaciones procedentes de una distribución normal con desconocidos media y la varianza. Aquí $n_1=20$$n_2=30$. Esto puede en definitiva ser formulado como $x_{ij}$ son realizaciones de variables aleatorias independientes $X_{ij}$ y $$ X_{ij}\sim \mathcal{N}(\mu_i,\sigma_i^2),\quad j=1,\ldots,n_i,\;\;i=1,2. $$
Deje $\bar{X}_1$ $\bar{X}_2$ denotar la muestra medio, es decir, $$ \bar{X}_i=\frac1{n_i}\sum_{j=1}^{n_i}X_{ij}\sim \mathcal{N}\left(\mu_i,\frac{\sigma_i^2}{n_i}\right)\quad i=1,2. $$ A continuación, $\bar{X}_i$ es la estimación de la verdadera media de $\mu_i$, y la diferencia de medios de $\mu_1-\mu_2$ es, por supuesto, estimado por $\bar{X}_1-\bar{X}_2$.
Hipótesis de Igualdad de Varianzas: Nosotros, además, asumir que la varianza en los dos grupos son iguales, es decir, $\sigma_1^2=\sigma_2^2$ y se denota la varianza común sólo por $\sigma^2$. Si $S_i^2$ denota la varianza de la muestra de la $i$th de la muestra, es decir, $$ S_i^2=\frac{1}{n_i-1}\sum_{j=1}^{n_i}\left(X_{ij}-\bar{X}_i\right)^2,\quad i=1,2, $$ entonces $$ S^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} $$ es el estimador de la varianza común $\sigma^2$. Ahora uno puede mostrar que $$ T=\frac{(\bar{X}_1-\bar{X}_2)-(\mu_1-\mu_2)}{\sqrt{S^2\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}\sim de t(f)\etiqueta{1} $$ donde $f=n_1+n_2-2$. Sabiendo que $T$ sigue una $t$-distribución con $f$ grados de libertad es exactamente lo que necesitamos para encontrar los intervalos de confianza y realizar pruebas.
$99\%$ intervalo de confianza: $99\%$ intervalo de confianza se obtiene mediante la manipulación de $(1)$ y obtenemos que $$ 99\%=P\left(\underbrace{\bar{X}_1-\bar{X}_2-C\cdot t_{0.995}(f)}_{\text{límite inferior}}\leq\mu_1-\mu_2\leq \underbrace{\bar{X}_1-\bar{X}_2+C\cdot t_{0.995}(f)}_{\text{límite superior}}\right) $$ donde $t_{0.995}(f)$ $99.5\%$ fractile de una $t$-distribución con $f$ grados de libertad y $$ C=\sqrt{S^2\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}. $$
Pruebas de hipótesis: Se desea probar la hipótesis estadística de que las dos son iguales, lo que significa que el servidor y el Servidor B son igual de rápido. La hipótesis es escrito como $$ H\!:\mu_1=\mu_2 $$ y, por supuesto, equivalente a probar eso $\mu_1-\mu_2=0$. Bajo la hipótesis, $(1)$ se convierte en $$ T=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{S^2\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}\sim de t(f)\etiqueta{2} $$ y como numéricamente grandes valores son fundamentales para la hipótesis de que obtener el $p$-valor $$ p=2\left(1-F_{t(f)}(|T|)\right), $$ donde $F_{t(f)}(\cdot)$ denota la CDF de una $t$-distribución con $f$ grados de libertad. Aceptamos $H$ si $p>0.01$ y la rechazará si $p<0.01$. La comprobación de si $p>0.01$ corresponde a la comprobación de si $\bar{X}_1-\bar{X}_2$ $99\%$ intervalo de confianza o no.
La Comprobación del modelo: Esta respuesta está basada en algunos crucial supuesto de que, por supuesto, tienen que ser revisados. Que esto es de hecho dos yo.yo.d. las muestras de distribuciones normales debe estar marcada. Además, en el supuesto de igualdad de varianzas debe ser revisado. Esto puede ser comprobado mediante la realización de una $F$-prueba.
a) $\overline{X_1}=6.7, s_1=0.6 , n_1=20$ $\overline{X_2}=7.5 , s_2=1.2, n_2=30$
$H_0$: $\mu_1=\mu_2 , \mu_1-\mu_2=0$ $H_A$: $\mu_1 \neq \mu_2$
df (grados de libertad)= 45
t(valores críticos)=$\pm 2.686 $
T(estadístico de prueba)=$\frac{\overline{X_1}-\overline{X_2}}{std(\overline{x_1}-\overline{X_2})}$
std=$\sqrt{V(\overline{X_1}-\overline{X_2})}=\sqrt{V(\overline{X_1})-V(\overline{X_2})}=\sqrt{\frac{0.6^2}{20}+\frac{1.2^2}{30}}=\sqrt{0.018+0.048}=\sqrt{0.66}=0.256$ $\overline{X_1}-\overline{X_2}=-0.8$
$T=\frac{-0.8}{0.256}=-3.112$
$T=-3.112$ no está en el rango de aceptación de -2.686 y 2.686 por lo que rechazamos la hipótesis nula
b) $p-value= P(T>3.112)+P(T<-3.112)= 2*0.001=0.002$
$0.002<0.01$ , por tanto, los resultados muestran que existe una diferencia altamente significativa entre los dos servidores.
c)$H_0 : \mu_1=\mu_2$
$H_A:\mu_1<\mu_2 , \mu_1-\mu_2<0$
$T=-3.112$ , $\alpha=0.01$ , $t_\alpha=2.4$ $p-value=P(T< -3.112)= 1-(1-valueOf(t_\alpha))=1-(1-0.001)=1-0.999=0.001$ $0.001<0.01$ por lo tanto no hay evidencias muy importante y rechazamos $H_0$
Conclusiones: a partir De a), b) y c) podemos decir que no es muy significativa evidencia de que existe una diferencia entre los dos servidores y que el servidor es más rápido que el servidor B.