7 votos

Interpretación de Cramér ' s V

Estoy tratando de entender el valor de Cramer V proporciona.

Me encontré con la siguiente frase (de aquí):

"V puede ser visto como la asociación entre dos variables como una porcentaje de su máxima variación posible. V^2 es la media del cuadrado correlación canónica entre las variables."

Pero no creo que lo entiendo completamente.

Por favor alguien puede ayudar a explicar un poco más (o con un ejemplo más detallado)?

4voto

Uri Puntos 111

La cita es correcta. Si se tienen dos variables categóricas y recodificar en dos conjuntos de variables ficticias y, a continuación, realizar el análisis de correlación canónica (CCA) en estos dos conjuntos (dejando fuera cualquier maniquí de cada conjunto redundante) - canónica de correlaciones (ver CCA algoritmopara calcular) el promedio de los cuadrados de los cuales es exactamente la Cramer V al cuadrado entre el original de las variables categóricas.

Un ejemplo de ello.

Two nominal variables A (3 categories) and B (4 categories) were recoded into dummy sets.
A   B  A1  A2  A3  B1  B2  B3  B4
1   1   1   0   0   1   0   0   0
1   1   1   0   0   1   0   0   0
1   2   1   0   0   0   1   0   0
1   2   1   0   0   0   1   0   0
1   4   1   0   0   0   0   0   1
2   1   0   1   0   1   0   0   0
2   1   0   1   0   1   0   0   0
2   2   0   1   0   0   1   0   0
2   2   0   1   0   0   1   0   0
2   2   0   1   0   0   1   0   0
2   2   0   1   0   0   1   0   0
2   2   0   1   0   0   1   0   0
2   3   0   1   0   0   0   1   0
2   3   0   1   0   0   0   1   0
2   4   0   1   0   0   0   0   1
2   4   0   1   0   0   0   0   1
3   1   0   0   1   1   0   0   0
3   1   0   0   1   1   0   0   0
3   2   0   0   1   0   1   0   0
3   4   0   0   1   0   0   0   1

Throwing one arbitrary dummy from each set out, compute correlations and perform CCA on one set (2 variables) vs the other set (3 variables).

You'll extract two pair of canonical latent roots with correlations:
Canonical correlations and Eigenvalues: 
        Can Corr     Eigenval 
1       .3921542     .1817327 
2       .0859611     .0074443

(.3921542^2 + .0859611^2) / 2 = 0.08059 = squared Cramer's V between A and B.      

Tenga en cuenta también que si una de las dos variables categóricas es dicotómica, el cuadrado de Cramer V es equivalente a R cuadrado de la regresión lineal de los maniquíes de la segunda variable.

Si usted se olvida de CCA de dummy variables y pensar acerca de la CCA en general, es decir, acerca de la CCA de cualquier numéricos de las variables cuantitativas, entonces usted puede saber más que la media (o la suma, para ser exactos) el cuadrado de la correlación canónica es lo que se conoce por el nombre de Pillai traza - la estadística que tiene el mismo significado en la regresión multivariante como el R-cuadrado tiene en univariante de regresión. Por lo tanto, Cramer V squared claramente parece ser homóloga a multivariante R-cuadrado (traza de Pillai); siendo V para dos variables categóricas y el R-cuadrado de ser para los dos conjuntos de variables cuantitativas. Este hecho arroja luz sobre la frase ...as a percentage of their maximum possible [shared] variation.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X