Esto no es una respuesta directa a su pregunta, pero sí ilustra la información que hay que introducir en un procedimiento de "potencia y tamaño de la muestra" para para obtener el tamaño de muestra requerido.
Supongamos que el número actual de "unidades de energía" por día para 30.000 hogares es $100.$ Con la nueva tecnología se espera que el consumo de energía por hogar se distribuya normalmente con una media $\mu < 100$ con $\sigma = 20.$ Se espera tener una potencia del 90% de detección de disminución de como tanto como $5$ unidades de energía. Por lo tanto, si el particular alternativa $H_a: \mu = 95$ es verdadera, usted quiere que la probabilidad de rechazo sea $0.9 = 90\%.$
Sin duda, parte de esta "información" puede ser desconocida y especulativa, pero todo lo anterior es información necesaria. (Se puede experimentar con ligeras variaciones de la entrada para ver el efecto de la salida).
A continuación se muestra el resultado de una versión reciente de Minitab para ilustrarlo:
Power and Sample Size
1-Sample t Test
Testing mean = null (versus < null)
Calculating power for mean = null + difference
α = 0.05 Assumed standard deviation = 20
Sample Target
Difference Size Power Actual Power
-5 139 0.9 0.901145
Así que en este escenario hipotético se necesitaría un tamaño de muestra de $n = 139$ para obtener la potencia deseada. El siguiente gráfico muestra la potencia para detectar una disminución de $5$ ---junto con otras posibles disminuciones.
Según mis hipótesis, parece factible instalar la nueva tecnología en unas 140 casas y hacer una un -prueba t de muestra de los resultados $H_0: \mu=100$ contra. $H_a: \mu < 100$ al nivel del 5%.
Notas: (1) Para los datos normales, estos cálculos utilizan un no central distribución t con grados de libertad $n - 1$ y un parámetro de no centralidad que depende de la potencia deseada, del tamaño de la diferencia a detectar y de la DE de la población prevista para el $n$ observaciones.
El hecho crucial es que $n = 129$ las observaciones bastan para dar 90% de potencia de una diferencia que es $5/20 = 1/4$ tan grande como la DS prevista.
Puede buscar este sitio y en Internet para encontrar explicaciones técnicas a su nivel. Este reciente PREGUNTAS Y RESPUESTAS puede ser útil.
(2) Muchos programas informáticos de estadística tienen procedimientos de "potencia y tamaño de la muestra". Hay una biblioteca en R con tales procedimientos para una variedad tipos de pruebas. Hay sitios en línea para calcular la potencia y el tamaño de la muestra pero no todos son fiables.
(3) En R, las funciones de probabilidad dt
, pt
y así sucesivamente tienen un (raramente utilizado) parámetro 'ncp` para el parámetro de no centralidad.
Simulación en R: Con 100.000 iteraciones, se puede esperar alrededor de dos lugares de precisión. Por lo tanto, la simulación coincide esencialmente con el resultado de Minitab.
set.seed(1121)
pv = replicate(10^5, t.test(rnorm(139, 95, 20), mu=100, alt="less")$p.val)
mean(pv <= 0.05)
[1] 0.89914