La cita es correcta. Si se tienen dos variables categóricas y recodificar en dos conjuntos de variables ficticias y, a continuación, realizar el análisis de correlación canónica (CCA) en estos dos conjuntos (dejando fuera cualquier maniquí de cada conjunto redundante) - canónica de correlaciones (ver CCA algoritmopara calcular) el promedio de los cuadrados de los cuales es exactamente la Cramer V al cuadrado entre el original de las variables categóricas.
Un ejemplo de ello.
Two nominal variables A (3 categories) and B (4 categories) were recoded into dummy sets.
A B A1 A2 A3 B1 B2 B3 B4
1 1 1 0 0 1 0 0 0
1 1 1 0 0 1 0 0 0
1 2 1 0 0 0 1 0 0
1 2 1 0 0 0 1 0 0
1 4 1 0 0 0 0 0 1
2 1 0 1 0 1 0 0 0
2 1 0 1 0 1 0 0 0
2 2 0 1 0 0 1 0 0
2 2 0 1 0 0 1 0 0
2 2 0 1 0 0 1 0 0
2 2 0 1 0 0 1 0 0
2 2 0 1 0 0 1 0 0
2 3 0 1 0 0 0 1 0
2 3 0 1 0 0 0 1 0
2 4 0 1 0 0 0 0 1
2 4 0 1 0 0 0 0 1
3 1 0 0 1 1 0 0 0
3 1 0 0 1 1 0 0 0
3 2 0 0 1 0 1 0 0
3 4 0 0 1 0 0 0 1
Throwing one arbitrary dummy from each set out, compute correlations and perform CCA on one set (2 variables) vs the other set (3 variables).
You'll extract two pair of canonical latent roots with correlations:
Canonical correlations and Eigenvalues:
Can Corr Eigenval
1 .3921542 .1817327
2 .0859611 .0074443
(.3921542^2 + .0859611^2) / 2 = 0.08059 = squared Cramer's V between A and B.
Tenga en cuenta también que si una de las dos variables categóricas es dicotómica, el cuadrado de Cramer V es equivalente a R cuadrado de la regresión lineal de los maniquíes de la segunda variable.
Si usted se olvida de CCA de dummy variables y pensar acerca de la CCA en general, es decir, acerca de la CCA de cualquier numéricos de las variables cuantitativas, entonces usted puede saber más que la media (o la suma, para ser exactos) el cuadrado de la correlación canónica es lo que se conoce por el nombre de Pillai traza - la estadística que tiene el mismo significado en la regresión multivariante como el R-cuadrado tiene en univariante de regresión. Por lo tanto, Cramer V squared claramente parece ser homóloga a multivariante R-cuadrado (traza de Pillai); siendo V para dos variables categóricas y el R-cuadrado de ser para los dos conjuntos de variables cuantitativas. Este hecho arroja luz sobre la frase ...as a percentage of their maximum possible [shared] variation
.