Su R
código piensa que usted tiene una tabla de contingencia de 2x2 para la prueba de chi-cuadrado, mientras que su 'a mano' de la versión trata de dos de sus valores como los valores esperados con los que comparar los dos primeros valores. Usted necesita decidir lo que la instalación es correcta y usarla de forma coherente en ambas ocasiones.
Aquí está su R
versión:
> test <- matrix(c(4203, 4218, 786, 771), ncol=2)
> dimnames(test) <- list(group = c("control","exp"), click = c("n","y"))
> print(test)
click
group n y
control 4203 786
exp 4218 771
> print(Xsq <- chisq.test(test, correct=F))
Pearson's Chi-squared test
data: test
X-squared = 0.1712, df = 1, p-value = 0.679
Esta es la manera de hacerlo "a mano":
\begin{array}{lrrr}
& &\text{click} & \\
\rm group &\rm n &\rm y &\rm proportion \\
{\rm control} &4203 &786 &0.50 \\
{\rm exp} &4218 &771 &0.50 \\
\rm proportion &0.844 &0.156
\end{array}
Aviso de que he añadido la fila y la columna de proporciones. Estos son tomados como estimación de la probabilidad de que una observación se caiga en cada fila (columna). La cuenta esperada en cada celda bajo el supuesto de independencia es la fila de probabilidad de los tiempos de la columna de probabilidad de los tiempos de la cuenta total. Para sus datos, que da lugar a:
\begin{array}{lrr}
&\text{click} & \\
\rm group &\rm n &\rm y \\
{\rm control} &4210.5 &778.5 \\
{\rm exp} &4210.5 &778.5 \\
\end{array}
Por consiguiente, el cálculo es:
$$
\frac{(4203-4210.5)^2}{4210.5} + \frac{(4218-4210.5)^2}{4210.5} + \frac{(786-778.5)^2}{778.5} + \frac{(771-778.5)^2}{778.5} = 0.1712,
$$
Que es lo mismo R
dio.
Si se toma el control
el número de filas como el esperaba cuenta, en lugar de a la cuenta de otra condición, tendría el siguiente para su 'mano' de cálculo:
$$
\frac{(4218-4203)^2}{4203} + \frac{(771 - 786)^2}{786} = 0.3398
$$
También puede ejecutar esta versión en R
como así:
> probs <- test[1,]/sum(test[1,])
> probs
n y
0.8424534 0.1575466
> chisq.test(test[2,], correct=F, p=probs)
Chi-squared test for given probabilities
data: test[2, ]
X-squared = 0.3398, df = 1, p-value = 0.5599
Que clave es la que se especifica el p
argumento con la espera de probabilidades (R
se encargará de calcular la espera de cuentas). En cualquier caso, se puede ver que el $\chi^2$ de los valores son una vez más el mismo.