2 votos

Tamaño mínimo de la muestra y prueba de potencia

Supongamos que tengo acceso a datos sobre el consumo de energía de una ciudad con una población de 30000 personas. Imaginemos que quiero probar una nueva tecnología de energía inteligente, es decir, si el consumo de energía disminuye con esta tecnología. Tengo que subdividir los 30k en un grupo más pequeño G en el que utilicen la tecnología y compararlo con el resto de la población (en el que no tienen esta tecnología). Entonces puedo hacer una prueba de hipótesis en la que la media del consumo de energía sea igual en ambos grupos y la hipótesis alternativa sea la contraria. Sin embargo, para asegurarme de que la tecnología fue la razón por la que se redujo el consumo de energía y no sólo una coincidencia, necesito obtener un nivel de significación (por ejemplo, 0,05) de un cierto nivel y un tamaño mínimo para el grupo G, ¿verdad?

También he leído que hay que hacer una prueba de potencia para evitar los errores de tipo I y II. ¿Pero es realmente necesario? Soy nuevo en este tema y esto me resulta muy confuso porque hay muchas fórmulas diferentes y no sé cuál es la correcta para determinar el tamaño del grupo G.

2voto

manku Puntos 111

Esto no es una respuesta directa a su pregunta, pero sí ilustra la información que hay que introducir en un procedimiento de "potencia y tamaño de la muestra" para para obtener el tamaño de muestra requerido.

Supongamos que el número actual de "unidades de energía" por día para 30.000 hogares es $100.$ Con la nueva tecnología se espera que el consumo de energía por hogar se distribuya normalmente con una media $\mu < 100$ con $\sigma = 20.$ Se espera tener una potencia del 90% de detección de disminución de como tanto como $5$ unidades de energía. Por lo tanto, si el particular alternativa $H_a: \mu = 95$ es verdadera, usted quiere que la probabilidad de rechazo sea $0.9 = 90\%.$

Sin duda, parte de esta "información" puede ser desconocida y especulativa, pero todo lo anterior es información necesaria. (Se puede experimentar con ligeras variaciones de la entrada para ver el efecto de la salida).

A continuación se muestra el resultado de una versión reciente de Minitab para ilustrarlo:

Power and Sample Size 

1-Sample t Test

Testing mean = null (versus < null)
Calculating power for mean = null + difference
α = 0.05  Assumed standard deviation = 20

            Sample  Target
Difference    Size   Power  Actual Power
        -5     139     0.9      0.901145

Así que en este escenario hipotético se necesitaría un tamaño de muestra de $n = 139$ para obtener la potencia deseada. El siguiente gráfico muestra la potencia para detectar una disminución de $5$ ---junto con otras posibles disminuciones.

enter image description here

Según mis hipótesis, parece factible instalar la nueva tecnología en unas 140 casas y hacer una un -prueba t de muestra de los resultados $H_0: \mu=100$ contra. $H_a: \mu < 100$ al nivel del 5%.

Notas: (1) Para los datos normales, estos cálculos utilizan un no central distribución t con grados de libertad $n - 1$ y un parámetro de no centralidad que depende de la potencia deseada, del tamaño de la diferencia a detectar y de la DE de la población prevista para el $n$ observaciones.

El hecho crucial es que $n = 129$ las observaciones bastan para dar 90% de potencia de una diferencia que es $5/20 = 1/4$ tan grande como la DS prevista.

Puede buscar este sitio y en Internet para encontrar explicaciones técnicas a su nivel. Este reciente PREGUNTAS Y RESPUESTAS puede ser útil.

(2) Muchos programas informáticos de estadística tienen procedimientos de "potencia y tamaño de la muestra". Hay una biblioteca en R con tales procedimientos para una variedad tipos de pruebas. Hay sitios en línea para calcular la potencia y el tamaño de la muestra pero no todos son fiables.

(3) En R, las funciones de probabilidad dt , pt y así sucesivamente tienen un (raramente utilizado) parámetro 'ncp` para el parámetro de no centralidad.

Simulación en R: Con 100.000 iteraciones, se puede esperar alrededor de dos lugares de precisión. Por lo tanto, la simulación coincide esencialmente con el resultado de Minitab.

set.seed(1121)
pv = replicate(10^5, t.test(rnorm(139, 95, 20), mu=100, alt="less")$p.val)
mean(pv <= 0.05)
[1] 0.89914

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X