15 votos

Modelo conjunto con términos de interacción vs regresiones separadas para la comparación de un grupo

Después de recopilar información valiosa de las anteriores preguntas y debates, que han venido con la siguiente pregunta: Supongamos que el objetivo es detectar el efecto de las diferencias entre los dos grupos, hombres vs mujeres, por ejemplo. Hay dos maneras de hacerlo:

  1. ejecución de dos regresiones separadas para los dos grupos, y a emplear la prueba de Wald para rechazar (o no) la hipótesis nula $H_0$: $b_1-b_2=0$, donde $b_1$ es el coeficiente de una IV en los hombres de regresión, y $b_2$ es el coeficiente de la misma IV en mujeres de regresión.

  2. la piscina de los dos grupos juntos, y ejecutar un conjunto modelo mediante la inclusión de género como un maniquí y un término de interacción (IV*genderdummy). A continuación, la detección del efecto de grupo se basa en el signo de la interacción y la prueba de t de significación.

Lo que si Ho es rechazada en el caso (1), es decir, la diferencia entre los grupos es significativa, pero el coeficiente del término de interacción en el caso de (2) es estadísticamente insignificante, es decir, la diferencia entre los grupos es insignifant. O viceversa, Ho no se rechaza en el caso (1), y el término de interacción es significativa en el caso (2). Me han terminado con este resultado, varias veces, y me preguntaba ¿cuál es el resultado sería más fiable, y cuál es la razón detrás de esta contradicción.

Muchas gracias!

7voto

Jim Sherhart Puntos 141

El primer modelo totalmente interactuar de género con todas las otras covariables en el modelo. En esencia, el efecto de cada covariable (b2, b3... bn). En el segundo modelo, el efecto del sexo es sólo interactuó con su IV. Así que, asumiendo que tienen más covariables que sólo la IV y de género, esto puede conducir a resultados algo diferentes.

Si usted acaba de tener las dos covariables, hay documentados ocasiones en las que la diferencia en la maximización entre la prueba de Wald y la prueba de razón de Verosimilitud conducen a respuestas diferentes (ver más información en la wikipedia).

En mi propia experiencia, yo trato de ser guiada por la teoría. Si hay una posición dominante en la teoría que sugiere que el género podría interactuar con sólo el IV, pero no las otras covariables, me gustaría ir con el parcial de interacción.

7voto

mat_geek Puntos 1367

En cualquier momento dos diferentes procedimientos que se utilizan para la prueba de hipótesis hay diferentes p-valores. Para decir que uno es importante, y la otra es que no se puede hacer un blanco y negro de decisión al nivel de 0.05. Si una prueba da un p-valor de 0.03 y los otros dicen 0.07 yo no lo llamaría los resultados contradictorios. Si usted va a ser que la estricta en la forma de pensar acerca de la significación es fácil tener cualquiera de las dos situaciones (i) o (ii) surgen cuando boardline significado es el caso.

Como he mencionado en la respuesta a la pregunta anterior mi preferencia para la búsqueda de una interacción es hacer una combinada de regresión.

2voto

Tyson Phalp Puntos 156

En el segundo caso, el software estándar de sugeriría que un t-stat con t-student pvalues mientras que para el primer caso las pruebas de Wald puede tener dos opciones. En virtud de los errores de la normalidad de la asunción de la estadística de Wald de la siguiente manera exacta de Fisher estadística (que es equivalente a la t-stat, ya que asume que el error de la normalidad). Mientras que en virtud de normalidad asintótica, Wald estadístico sigue una distribución Chi2 (que es analague a la de un t-stat siguiendo una distribución normal asimptotically) ¿Qué distribución están asumiendo ? Dependiendo de tu p-valores de riesgo para dar resultados diferentes.

En los Libros de texto usted encontrará que para bilaterales único pruebas (un parámetro) ambos, t-student y Fisher de estadísticas son equivalentes.

Si la muestra no es grande, la comparación de la comparación de chi2 y t-stat pvalues puede dar diferentes resultados por cierto. En ese caso, suponiendo un asintótica dsitribution no sería razonable. SI la muestra es muy pequeño, entonces suponiendo normalidad parece más razonable, esto implica t-stat y Fisher pvalues para el caso 2 y 1 respectivamente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X