Ya he leído todas las páginas de este sitio tratando de encontrar la respuesta a mi problema pero ninguna parece ser la adecuada para mí...
Primero te explico el tipo de datos con los que estoy trabajando...
Digamos que tengo un vector array con varios nombres de ciudad, uno por cada uno de los 300 usuarios. También tengo otro vector array con las puntuaciones de respuesta a una encuesta de cada usuario o un valor continuo para cada usuario.
Me gustaría saber si existe un coeficiente de correlación que calcule la correlación entre estas dos variables, es decir, entre una variable nominal y una numérica/continua u ordinal.
He buscado en Internet y en algunas páginas sugieren utilizar el coeficiente de contingencia o la V de Cramer o el coeficiente Lambda o Eta . Para cada una de estas medidas lo único que dicen es que se pueden aplicar para esos datos en los que tenemos una variable nominal y una variable de intervalo o numérica. El caso es que buscando y rebuscando, tratando de entender cada una de ellas, alguna vez se escribe o se ven los ejemplos de que son razonables para usarlas si se tiene variable nominal dicotómica, excepto la V de Cramer, otra vez no se escribe ningún requisito para el tipo de datos. Muchas otras páginas dicen que es correcto aplicar la regresión en su lugar, eso es correcto, pero simplemente me gustaría saber si hay un coeficiente como el de pearson/spearman para este tipo de datos.
También creo que no es tan correcto utilizar el coeficiente de correlación de Spearman ya que las ciudades no son ordenables.
También he construido la función de Cramer'sV y Eta por mí mismo (estoy trabajando con Matlab) pero para Eta no hablan de ningún valor p para ver si el coeficiente es estadísticamente significativo...
En el sitio de matlabWorks también hay una bonita caja de herramientas que dice calcular eta^2 pero el tipo de entrada que necesita no es comprensible.
¿Hay alguien que haya hecho una prueba como la mía? Si necesitas más detalles para entender el tipo de datos que estoy usando solo pregúntame e intentaré explicarte mejor.
1 votos
Cramérs V es para dos nominales. ¿Qué tiene de malo la regresión? Tomar la variable numérica como respuesta y regresarla a la nominal (usando dummies). Mira la $R^2$ y la prueba F global asociada.
0 votos
No hay nada de malo en la regresión, pero como ya tenemos esa medida nos gustaría comprobarla de otra manera como doble comprobación con un coeficiente de correlación....gracias por la respuesta
0 votos
No has dicho nada específico sobre tu variable "numérica/ordinal". Qué ¿te hace plantearlo ordinal? ¿numérico?
0 votos
Ordinal porque tengo una variable proveniente de un test de encuesta por lo que su rango es -4,4, también se puede pensar como intervalo pero este tipo de variables de encuesta se consideran mayormente como ordinales y las otras son numéricas, en concreto continuas ya que son características extraídas.
1 votos
VER TAMBIÉN la pregunta relacionada stats.stackexchange.com/questions/23938/
0 votos
Y ver también stats.stackexchange.com/q/301085/3277