9 votos

¿Por qué cambia el modelo cuando se usa relevel?

En el cómputo de los modelos de regresión con R, habitualmente utilizo el relevel función para obtener mi modelo para darme los resultados de los otros, también. Me di cuenta de que a veces, pero no a menudo, esto ha cambiado el modelo, en el sentido de que los niveles de los otros factores que fueron importantes antes de la relevelling no son más. Es inherente a relevelling o excepcional, y tal vez debido a algún problema con mis datos? Qué muestra de que mis datos probable que no cumple uno de los requisitos previos de modelos lineales?

En relación a eso, está bien si uso relevel, se vuelve a calcular mi modelo y, a continuación, informe de la importancia de los valores de ambos modelos en mi artículo? Si el significado es diferente entre los dos modelos de un determinado factor, supongo que debería ir con uno que es menos optimista?

Supongo que mi pregunta delata que no sé lo suficiente acerca de la película de comprender la necesidad de un nivel de base. Yo pensaba que entendía bastante bien ;) de alguna manera, ninguna de las introducciones que he leído explicó que punto, o que era demasiado tonto para entenderlo. Así que si alguien puede me dirija a un sitio donde el punto de tener los niveles de base de la película se explica o explicar que sí, que iba a ser genial también!

Edit: he Aquí un ejemplo mínimo:

library(datasets)
sprays<-OrchardSprays
model<-lm(decrease~treatment+rowpos+colpos,data=sprays)
summary(model)

Parte del resumen dice

treatmentC    20.625      9.731   2.120  0.03866 *

Así que si el tratamiento == C esto tiene importante influencia positiva sobre 'disminuir'. Ahora me relevel 'tratamiento' a B para averiguar lo que la influencia del tratamiento == a tiene:

sprays$treatment<-relevel(sprays$treatment,"B")
summary(model)

Y ahora trato == C no es significativa en este nuevo modelo:

treatmentC    17.625      9.731   1.811  0.07567 .

Lo siento por la publicación en el lugar equivocado! Puedo mover mi pregunta estadísticas statexchange o debo abrir uno nuevo no?

9voto

Wouter Coekaerts Puntos 3494

Supongamos que el factor de conditions tiene niveles, A,B,C y la regresión en su respuesta variables y en condiciones de uso mod <- lm(y ~ conditions). Ahora summary(mod) devuelve la media de los niveles de referencia de conditions (decir A) y la diferencia de medias entre condiciones B y A y la diferencia entre las condiciones C y A (reportado, respectivamente, como (Intercept), conditions:By conditions:C). Si usted conditions <- relevel(conditions, ref = 'B') y re-reun el modelo lineal, ahora tendrás la media de B, la diferencia entre A y B, y la diferencia entre C y A. Naturalmente, los valores de p podría cambiar. Esto no significa que hay un problema con sus datos. Esto no significa que sus datos fallar necesariamente una suposición de un modelo lineal. El ajuste es el mismo y simplemente se ha cambiado la información de la que se imprime, ya que han cambiado el nivel de referencia y el uso de tratamiento de contrastes. Usted puede conseguir el mismo lineal de las pruebas de hipótesis usando la original mod.

En cuanto a lo que informe, en muchos campos, es habitual que informe si hubo un efecto estadísticamente significativo de la conditions (usando la salida de anova(mod)) e informar a la regresión completa de salida en una tabla (con independencia de los niveles de referencia que te gustaría). Normas de cómo y si se informe de las pruebas de A vs B (por ejemplo) varían según el campo. Echa un vistazo de cerca a buenos papeles en su campo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X