Para una persona seleccionada al azar de una población, sea $X$ ser sus seguidores de Instagram y $Y$ ser sus seguidores en Facebook. Tomamos una muestra aleatoria de los seguidores de $n$ personas, $(X_1, Y_1), ..., (X_n, Y_n)$ . Sea $D = X - Y$ y $D_i = X_i - Y_i$ para $i = 1, ..., n$ . Supongamos que podemos modelar con precisión $D$ como una variable aleatoria normal, pero cuya media $\mu_D$ y varianza $\sigma^2_D$ son desconocidos.
(a) Tomamos $n = 7$ muestras:
$X_i: 118, 136, 125, 121, 111, 142, 114$
$Y_i: 81, 91, 63, 78, 59, 93, 83$
Determinar un $95$ % de intervalo de confianza para $\mu_D$ .
(b) Investigaciones recientes sugieren que $\mu_D = 40$ . Afirmamos que la diferencia media entre los seguidores de Instagram y Facebook ha aumentado, y tomamos $n = 17$ muestras aleatorias. Utilice el estadístico de prueba $\frac{\bar{D} - 40}{\frac{S_D}{\sqrt{17}}}$ para formar una prueba en el $0.05$ nivel de significación.
Intenté hacer esto
(a) Hice algunos cálculos y descubrí que las estadísticas de la muestra son:
$\bar{x} = 123.86, s_x = 11.42, \bar{y} = 78.29, s_y = 13.00$
Por el estadístico de Welch, encontramos los grados de libertad como
$$\Delta = \frac{(\frac{s_x^2}{n_x} + \frac{s_y^2}{n_y})^2}{\frac{1}{n_x - 1}(\frac{s_x^2}{n_x})^2 + \frac{1}{n_y - 1}(\frac{s_y^2}{n_y})^2}$$
Introduciendo los valores se obtiene $\Delta = 11$ .
El valor de $t_{\alpha /2}$ en $0.025$ con $11$ grados de libertad, a partir de las tablas, es $2.01$ .
Por lo tanto, el intervalo es
$$((\bar{x} - \bar{y}) - t_{\alpha / 2}\cdot \sqrt{s_x^2/n_x + s_y^2/n_y}, (\bar{x} - \bar{y}) + t_{\alpha / 2}\cdot \sqrt{s_x^2/n_x + s_y^2/n_y})$$
$$= (34.6, 56.6)$$
De otra manera:
$\mu_D = 45.57, s_D = 10.13$ .
$t_{\alpha/2}$ con $\alpha = 0.05$ y $6$ grados de libertad es $2.447$ .
El intervalo es:
$(\bar{d} - t_{\alpha/2} \cdot \frac{s_D}{\sqrt{n}}, \bar{d} - t_{\alpha/2} \cdot \frac{s_D}{\sqrt{n}})$
$= (36.20, 54.94)$
Ambos métodos dan valores similares, pero no estoy seguro de cuál es el correcto.
(b) $H_0: \mu_D = 40$ y $H_1: \mu_D > 40$ .
$t_{\alpha}$ con $\alpha = 0.05$ y $16$ grados de libertad es de $1.75$ .
La región crítica es
$$\frac{\bar{d} - 40}{\frac{s_d}{\sqrt{17}}} \geq 1.75$$
Rechazamos la hipótesis nula si el estadístico de la prueba es mayor o igual que $1.75$ .
¿Es correcto lo que he hecho? Para (a), ¿qué método se supone que es el correcto?