7 votos

¿Qué tipo de regresión usar con 1 a 10 variables dependientes de la escala?

Soy un poco nuevo en analytics. Tengo este conjunto de datos de encuesta con los atributos de abajo.

Variable independiente:

  • una. Se nos de confianza? (Valor: de 1 a 10)
  • b. Ofrecemos soluciones que usted necesita (Valor: de 1 a 10)
  • c. Somos proactivos (Valor: de 1 a 10)
  • d. Qué nos proporciona una calidad de servicio constante (Valor: de 1 a 10)
  • e. Proveemos un servicio excepcional (Valor: de 1 a 10)

Variable dependiente:

  • Cómo es probable que se nos recomienden a otros? (Valor: de 1 a 10)

Aquí quiero hacer una regresión entre la DV y IV. Anteriormente he hecho de regresión logística en lenguaje R para binomial resultados y continua de IVs. Pero este escenario se compone de la totalidad de datos ordinal.

¿Cómo puedo retroceder de esta información y de encontrar alguna relación? Por favor comparta sus ideas sobre técnicas útiles para resolver esto. Aparte de regresión, ¿hay algún otro método?

3voto

Jack Puntos 18

Aquí se muestra R ejemplo usando el paquete MASS con polr función (respuesta factorial ordenada) que puede usar enlace logístico o ser probit.

 library(MASS);
recmodel=polr(recom~trust+solutions+proact+qs+es,data=surveydata,method=c("logistic"));  
summary(recmodel);  
 

Creo que es importante dar a R aviso que todas las variables son ordinal, lo que significa que no debe usarlas como variables de intervalo.

La inferencia se puede hacer como una comparación con alguna línea de base. Por ejemplo, el valor 1 puede ser tal.

2voto

Martin Cowie Puntos 1152

1) a Juzgar por las preguntas de la encuesta, la probabilidad de multi-colinealidad es alta. Definitivamente, usted debe comprobar la correlación de VIF y entre sus variables predictoras antes de pensar en correr la regresión.

2) Aparte de la regresión y a costa de parecer simplista, yo sugiero que usted haga algunas estadísticas de resumen y análisis de exploración. a) ¿Cuál es la distribución de las respuestas para cada pregunta? b) Dependiendo de la respuesta individual de la pregunta, de cómo la variable de respuesta se mueve. Por ejemplo: ¿Qué % de las personas que clasificaron entre 5 y 7 en la pregunta 2, también dijo que era probable (calificación superior a 7) recomendar a los demás?

El análisis descriptivo visualizar y dar buena dirección de donde usted necesita para la cabeza con el análisis de regresión.

1voto

WebDude Puntos 135

Como se señala en los comentarios, la variable dependiente se puede manejar con logit ordinal. Para las variables independientes, el enfoque más flexible es convertir cada variable a 10 variables dummy (suponiendo que se suprima la constante del modelo). La interpretación se pondrá un poco desordenada, pero no está imponiendo ninguna hipótesis de forma funcional sobre las variables independientes.

1voto

tuomassalo Puntos 376

También puede probar el estereotipo de modelo de regresión logística (un tipo de reducción de rango generalizada del modelo de regresión lineal) que relaja la restricción de los pedidos (sin volver a un modelo de regresión logística multinomial, que con diez resultado, los niveles de presentar una gran cantidad de parámetros que pueden obstaculizar su capacidad para interpretar las relaciones en el tee de salida de datos). La restricción de ordenamiento se basa en la proporcionalidad de probabilidades de asunción, que pueden ser violados en algunos casos cuando se utiliza el modelo de regresión ordinal. Ver ?rrvglm en la VGAM paquete de ejemplos sobre la colocación del estereotipo de modelo logístico.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X