Processing math: 100%

22 votos

¿Cuál es la forma correcta de comprobar si existen diferencias significativas entre los coeficientes?

Espero que alguien me pueda aclarar un punto de confusión. Digamos que quiero probar si 2 conjuntos de coeficientes de regresión son significativamente diferentes entre sí, con la siguiente configuración:

  • yi=α+βxi+ϵi con 5 variables independientes.
  • 2 grupos, con tamaños aproximadamente iguales n1,n2 (aunque esto puede variar)
  • Se harán miles de regresiones similares simultáneamente, por lo que hay que hacer algún tipo de corrección múltiple de hipótesis.

Un enfoque que me sugirieron es utilizar una prueba Z:

Z=b1b2(SEb21+SEb22)

Otra que he visto sugerida en este foro es introducir una variable ficticia para la agrupación y reescribir el modelo como:

yi=α+βxi+δ(xigi)+ϵi donde g es la variable de agrupación, codificada como 0, 1.

Mi pregunta es, ¿en qué se diferencian estos dos enfoques (por ejemplo, en las distintas suposiciones que se hacen, en la flexibilidad)? ¿Es uno más apropiado que el otro? Sospecho que esto es bastante básico, pero cualquier aclaración sería muy apreciada.

17voto

jldugger Puntos 7490

Los dos enfoques difieren.

Sean los errores estándar estimados de las dos regresiones s1 y s2 . Entonces, como la regresión combinada (con todas las interacciones coeficiente-dummy) ajusta los mismos coeficientes, tiene los mismos residuos, por lo que su error estándar puede calcularse como

s=(n1p)s21+(n2p)s22)n1+n22p.

El número de parámetros p es igual a 6 en el ejemplo: cinco pendientes y un intercepto en cada regresión.

Sea b1 estimar un parámetro en una regresión, b2 estimar el mismo parámetro en la otra regresión, y b estimar su diferencia en la regresión combinada. A continuación, sus errores estándar se relacionan mediante

SE(b)=s(SE(b1)/s1)2+(SE(b2)/s2)2.

Si no ha realizado la regresión combinada, sino que sólo dispone de las estadísticas de las regresiones por separado, introduzca la ecuación anterior para s . Este será el denominador para la prueba t. Evidentemente no es el mismo que el denominador presentado en la pregunta.

El supuesto de la regresión combinada es que las varianzas de los residuos son esencialmente las mismas en ambas regresiones por separado. Sin embargo, si este no es el caso, la prueba z tampoco va a ser buena (a menos que el tamaño de las muestras sea grande): sería mejor utilizar una prueba Prueba CABF o Prueba t de Welch-Satterthwaite.

11voto

Brant Bobby Puntos 4540

La forma más directa de probar una diferencia en el coeficiente entre dos grupos es incluir un término de interacción en tu regresión, que es casi lo que describes en tu pregunta. El modelo que se ejecutaría es el siguiente:

yi=α+βxi+γgi+δ(xi×gi)+εi

Obsérvese que he incluido la variable de grupo como regresor independiente en el modelo. Con este modelo, a t -prueba con la hipótesis nula H0:δ=0 es una prueba de que los coeficientes son iguales entre los dos grupos. Para comprobarlo, dejemos primero que gi=0 en el modelo anterior. Entonces, obtenemos la siguiente ecuación para el grupo 0:

yi=α+βxi+εi

Ahora bien, si gi=1 entonces tenemos:

yi=(α+γ)+(β+δ)xi+εi

Así, cuando δ es 0, entonces dos grupos tienen el mismo coeficiente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X