Tengo varias covariables en mi cálculo para un modelo, y no todas son estadísticamente significativas. ¿Debo eliminar las que no lo son?
Esta pregunta discute el fenómeno, pero no responde a mi pregunta: ¿Cómo interpretar el efecto no significativo de una covariable en el ANCOVA?
Sin embargo, no hay nada en la respuesta a esa pregunta que sugiera que se eliminen las covariables no significativas, por lo que ahora mismo me inclino a creer que deben permanecer. Antes incluso de leer esa respuesta, pensaba lo mismo, ya que una covariable puede seguir explicando parte de la varianza (y, por tanto, ayudar al modelo) sin explicar necesariamente una cantidad más allá de algún umbral (el umbral de significación, que veo que no es aplicable a las covariables).
Hay otra pregunta en algún lugar de CV para la que la respuesta parece implicar que las covariables deben mantenerse independientemente de la significación, pero no está claro. (Quiero enlazar con esa pregunta, pero no he podido volver a localizarla ahora mismo).
Entonces... ¿Las covariables que no aparecen como estadísticamente significativas deben mantenerse en el cálculo del modelo? (He editado esta pregunta para aclarar que las covariables nunca están en la salida del modelo por el cálculo de todos modos).
Para añadir una complicación, ¿qué pasa si las covariables son estadísticamente significativas para algunos subconjuntos de los datos (subconjuntos que deben procesarse por separado). Yo mantendría por defecto dicha covariable, ya que de lo contrario habría que utilizar modelos diferentes o faltaría una covariable estadísticamente significativa en uno de los casos. Sin embargo, si también tiene una respuesta para este caso dividido, por favor menciónela.