5 votos

Correlación entre variables discretas y continuas

Estoy utilizando una escala que consta de valores discretos 0 (normal), 1 (leve), 2 (moderado), 3 (grave). He utilizado esta escala para 200 pacientes.

Voy a encontrar la correlación de esta escala con algunas variables continuas, estas variables también se midieron para 200 pacientes.

No creo que pueda utilizar la regresión multivariada o múltiple porque la variable dependiente es discreta y las variables independientes son continuas. ¿Pueden sugerirme un método para encontrar esta correlación?

3 votos

¿Ha pensado, en cambio, en utilizar técnicas más potentes y reveladoras que un coeficiente de correlación? Por ejemplo, ¿ha dibujado gráficos de caja paralelos de las variables continuas, divididos por su posición en la escala? Estos gráficos no sólo mostrarán la naturaleza de la asociación, sino que también pueden sugerir formas de reexpresar tanto los valores continuos como los códigos numéricos en su escala para que la posterior modelización lineal sea más aplicable.

7voto

Nick Cox Puntos 22819

La discreción no es un problema, sino la escala ordinal (ordenada, graduada) utilizada para su evaluación de normal a grave. Esto implica algo diferente a la regresión lineal estándar, es decir, algún método de regresión ordinal como el logit ordenado o el probit ordenado.

Tenga en cuenta, por cierto, que la regresión multivariante no es lo mismo que la regresión múltiple.

0 votos

Voy a generar estos valores discretos mediante un algoritmo de aprendizaje automático y son el objetivo . Las variables continuas son las características para el aprendizaje automático. Estaba pensando que tal vez la correlación de Spearsman o la regresión pueden ser un buen método para encontrar las características más eficaces en la predicción de valores discretos. Tengo que saber qué características pueden ser la mejor opción?

0 votos

Este comentario no aclara más su pregunta en lo que a mí respecta. Si sus datos son sintéticos, ¿qué hay que descubrir? La correlación y la regresión estándar son métodos pobres para una respuesta graduada u ordinal con cuatro niveles distintos.

0 votos

0 (normal), 1 (leve), 2 (moderado), 3 (grave) y estos valores son para 4 componentes. Cada paciente tiene cuatro números discretos. Voy a encontrar la correlación de esta escala con algunas variables continuas, estas variables continuas también se miden para 200 pacientes. Objetivo: Generar estos valores discretos mediante un algoritmo de aprendizaje automático basado en las variables continuas. 1. ¿Cuál es el mejor método para la selección de características (variables continuas)? ¿Correlación de Spearsamn? ¿Si las variables continuas están altamente correlacionadas con los valores discretos, significa que debo considerarlas como características?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X