Estoy un poco desconcertado con la siguiente cuestión: el resultado de la prueba ANOVA de una vía muestra que la diferencia media de la variable y entre dos muestras de países es estadísticamente significativa. Sin embargo, tras agrupar las dos muestras y realizar una regresión OLS con y como variable dependiente, algunos otros IV e incluyendo una variable ficticia de país, el efecto de la variable ficticia de país parece ser estadísticamente insignificante, lo que implica que no hay ningún efecto relacionado con el país en la variable dependiente y. ¿Alguna explicación para este resultado?
Respuestas
¿Demasiados anuncios?Si estoy en lo cierto al adivinar que la otra vía era no incluido en el ANOVA, entonces la razón más probable es que los dos países difieren en el otro IV, y que los países sólo parecen "significativos" si se omite el otro IV. Me pregunto si el otro IV es "significativo". Si hay suficiente confusión, puede que no lo sea. Una última posibilidad (pero creo que poco probable) es que al añadir el IV se pierda 1 grado de libertad, y así si el IV fuera totalmente sin relación con la respuesta, se habría perdido una cantidad trivial de poder estadístico.
Además de las otras respuestas, usted escribió
el efecto de la variable ficticia del país parece ser estadísticamente insignificante, lo que implica que no hay ningún efecto relacionado con el país en la variable dependiente y.
Eso no es lo que implica un resultado no significativo. De hecho, a menos que las medias de Y para los dos países fueran idénticas (algo extremadamente improbable), se sabe que hay fue una diferencia en su muestra. Y la posibilidad de que haya una diferencia 0 en la población es infinitesimal.
Un resultado no significativo no implica nada. Simplemente dice que, si la diferencia en la población fuera 0, se podría obtener un estadístico de prueba tan alto más del 5% de las veces.
Esto puede ser lo mismo que la respuesta de gung pero lo ve de forma ligeramente diferente y creo que esto podría ayudar a la comprensión e interpretación. El IV está altamente correlacionado con el país. Por lo tanto, si el indicador de país ayuda a predecir la respuesta, el IV también podría hacerlo. Por lo tanto, cada uno de ellos sería significativo por sí mismo, pero si se incluyen juntos, sólo lo será uno. Por lo tanto, probablemente sería mejor para la predicción, especialmente si el tamaño de la muestra es pequeño, incluir sólo uno de los dos. La elección de uno de ellos sólo importaría si se preocupa por la causalidad. El problema que esto causa se llama a menudo confusión, que es parte de lo que Gung estaba discutiendo.