Mi diseño es el siguiente: dos tratamientos, T1 y T2. La población se divide en 4 tramos de edad, y los números absolutos de sujetos inscritos son:
Edad
Tratar1
Tratar2
12-39
1387907
12196048
40-59
876762
14314721
60-79
295045
11928111
80plus
93709
4233887
El resultado. es decir, los sujetos que muestran un determinado efecto, son:
Edad
Tratar1
Tratar2
12-39
31
90
40-59
32
219
60-79
49
737
80plus
33
991
Ahora, me gustaría ver si hay una diferencia significativa entre Treat1 y Treat2, dado este resultado. Mi idea era realizar una prueba z de 2 muestras para proporciones para cada grupo de edad. Por ejemplo, para 12-39 :
p1 \= 31/1387907 = 0.000022
N1 \= 1387907
p2 \= 90/12196048 = 0.000007
N2 \= 12196048
Resultado de la prueba z de dos colas para dos proporciones:
z = 5.7
p-val < 0,0001
Así que esto parece significativo .
Repitiendo esto para todos los grupos de edad, consigo que son significativamente diferentes . Ahora bien, ¿es ésta la forma correcta de comprobar estos datos? Si es así, la siguiente pregunta: ¿por qué cuando reúno a todos los sujetos (sin tener en cuenta los grupos de edad) y realizo una prueba z, no resulta significativa? Por ejemplo
p1 \= (31+32+49+33)/(1387907+876762+295045+93709) = 0.000055
N1 \= 2653423
p2 \= (90+219+737+991)/(12196048+14314721+11928111+4233887) = 0.000048
N2 \= 42672767
Resultado de la prueba z de dos colas para dos proporciones:
z = 1.6
p-val = 0,1118
¿Es esto normal, aunque me parezca un poco contraproducente?
Gracias por ayudar a un novato total :)