Utilicé modelos lineales mixtos generalizados (con el glmmADMB
package) para identificar los factores ambientales relacionados con la abundancia de parásitos en los roedores. Utilicé la eliminación hacia atrás por pasos para simplificar secuencialmente el modelo completo hasta que sólo quedaran los factores significativos y los términos de interacción (Crawley, 2007). Sin embargo, cuando comprobé el resumen del modelo final, uno de los factores dejó de ser significativo ( p = 0.087
). Sin embargo, en las pruebas de ANOVA que condujeron al modelo final, esta variable (temperatura) es significativa:
Resumen del modelo final:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.131658 0.213630 15.33 < 2e-16
temperature -0.004019 0.0033143 -1.71 0.08673 .
anova
Model 1: parasites ~ age + vegetation + synchrony
Model 2: parasites ~ temperature + age + vegetation + synchrony
NoPar LogLik Df Deviance Pr(>Chi)
1 7 -550.75
2 8 -546.81 1 7.898 **0.004949**
Mis preguntas son: ¿qué valor de significación debo comunicar? ¿Significa esto que la temperatura no es importante? He visto manuscritos que informan de los valores del resumen del modelo final, pero también algunos que informan de los valores de significación de las comparaciones del modelo, ¿cuál es el correcto?
10 votos
La regresión escalonada ha sido ampliamente desacreditada. ¿Qué es lo que le hace pensar que funciona correctamente?
1 votos
Yo no diría que $p$ son simplemente mal vistos por los estadísticos de mentalidad óptima; el verdadero peligro con ellos es la mala interpretación, o posiblemente la confianza excesiva en ellos para fines que no son adecuados. La regresión escalonada es probablemente más difícil de defender (véase también este , este y este ). Lo siento por ese asesor tuyo :\N - De todos modos, estos parecen $p$ s de dos tipos de pruebas diferentes.
3 votos
Permitir que un asesor defienda una práctica estadística terrible es simplemente inaceptable.