Tengo tres grupos de datos, cada uno con una distribución binomial (es decir, cada grupo tiene elementos que son ya sea de éxito o de fracaso). No tengo una predicción de la probabilidad de éxito, sino que sólo puede basarse en la tasa de éxito de cada uno como una aproximación de la verdadera tasa de éxito. Sólo he encontrado esta pregunta, que está cerca, pero no parece exactamente de acuerdo con este escenario.
Para simplificar la prueba, vamos a decir que tengo 2 grupos (3 puede ser extendido a partir de este caso base).
- Grupo 1 ensayos: $n_1$ = 2455
- Grupo 2 ensayos: $n_2$ = 2730
- Éxito en el grupo 1: $k_1$ = 1556
- El grupo 2 de éxito: $k_2$ = 1671
No tengo una probabilidad de éxito que se esperaba, sólo lo que yo sé de las muestras. Así que mi implícita tasa de éxito para los dos grupos es:
- Grupo 1 tasa de éxito: $p_1$ = 1556/2455 = 63.4%
- Grupo 2 tasa de éxito: $p_2$ = 1671/2730 = 61.2%
La tasa de éxito de cada una de las muestras es bastante cerca. Sin embargo, mi tamaños de muestra son también muy grande. Si la CDF de la distribución binomial para ver lo diferente que es a partir de la primera (donde estoy suponiendo que la primera es la nula de la prueba) consigue una muy pequeña probabilidad de que la segunda podría ser alcanzado.
En Excel:
1-BINOM.DIST(1556,2455,61.2%,TRUE) = 0.012
Sin embargo, esto no toma en cuenta cualquier variación en el resultado de la primera, se asume que el primer resultado es la prueba de la probabilidad.
Existe una mejor forma de probar si estas dos muestras de datos de la realidad son estadísticamente diferentes el uno del otro?