Actualmente estoy tratando de hacer una regresión por MCO con datos de productos en línea de los comentarios y tengo dos preguntas:
¿Tengo que usar ambos, la lineal y la cuadrática efecto en el modelo o es también bueno para mantener sólo el cuadrado de la variable en el modelo? He leído que tengo que usar ambos, pero realmente no entiendo por qué. Así que, ¿por qué debería ser así?
Estoy haciendo una regresión con una amabilidad puntaje de la línea de comentarios de productos como la variable dependiente y la clasificación por estrellas de los comentarios (enteros entre 1 y 5) como una variable independiente. Me gustaría incorporar un cuadrado en efecto, debido a que la hipótesis de que el 1 y 5 grados de la estrella son más útiles que moderar los comentarios (por ejemplo, 3 estrellas). Cuando acabo la plaza de la clasificación por estrellas puedo obtener 0, 1, 4, 9, o 25 como valores posibles para el cuadrado de la variable. Sin embargo, para mí tiene mucho más sentido a la primera resta 3 de la clasificación y, a continuación, la plaza de las variables, ya que este refleja mejor la hipótesis de que la extremer una calificación mayor será su utilidad puntuación. Ahora, tengo 4, 1, 0, 1, o 4 como valores posibles para el cuadrado de la variable. Tendría sentido hacer esto?
Gracias por sus respuestas!