Tengo dos grupos de compradores, A
y B
, y quiero probar si la diferencia entre el porcentaje de ellos que iba a comprar un producto es importante.
- Grupo a: 271 de 2520 comprado el producto (10,8%) y 2,249 no comprar.
- Grupo B: 1,073,839 de 41,873,457 comprado el producto (2.6%) y 40,799,618 no comprar.
He utilizado chisq.test()
para llevar a cabo una $\chi^{2}$ prueba para responder a la pregunta de si el porcentaje de compradores a través de mis grupos tiene una diferencia significativa (yo diría que el 10,8% y el 2,6% son bastante diferentes).
library(vcd)
data <- rbind(x=c(271,1073839), n=c(2249, 40799618))
chisq.test(data)
# Pearson's Chi-squared test with Yates' continuity correction
#
# data: data
# X-squared = 672.9477, df = 1, p-value < 2.2e-16
assocstats(data)
# X^2 df P(> X^2)
# Likelihood Ratio 382.03 1 0
# Pearson 676.22 1 0
#
# Phi-Coefficient : 0.004
# Contingency Coeff.: 0.004
# Cramer's V : 0.004
Por lo que el $p$-valor que dice que hay una diferencia significativa, la Cramer $V$ dice que no la hay. ¿Cómo es posible que con una gran diferencia en las proporciones (grupo A
tiene más de 4 veces más en las ventas) no hay ninguna diferencia significativa de acuerdo a Cramér $V$?