32 votos

Prueba de Wald en regresión (OLS y GLM): distribución t vs. z

Tengo entendido que la prueba de Wald para los coeficientes de regresión se basa en la siguiente propiedad que se mantiene asintóticamente (por ejemplo, Wasserman (2006): Todas las estadísticas , páginas 153, 214-215): $$ \frac{(\hat{\beta}-\beta_{0})}{\widehat{\operatorname{se}}(\hat{\beta})}\sim \mathcal{N}(0,1) $$ Donde $\hat{\beta}$ denota el coeficiente de regresión estimado, $\widehat{\operatorname{se}}(\hat{\beta})$ denota el error estándar del coeficiente de regresión y $\beta_{0}$ es el valor de interés ( $\beta_{0}$ suele ser 0 para comprobar si el coeficiente es significativamente diferente de 0). Por lo tanto, el tamaño $\alpha$ La prueba de Wald es: rechazar $H_{0}$ cuando $|W|> z_{\alpha/2}$ donde $$ W=\frac{\hat{\beta}}{\widehat{\operatorname{se}}(\hat{\beta})}. $$

Pero cuando se realiza una regresión lineal con lm en R, un $t$ -en lugar de un $z$ -se utiliza para comprobar si los coeficientes de regresión difieren significativamente de 0 (con summary.lm ). Además, la salida de glm en R a veces da $z$ - y a veces $t$ -como estadísticas de prueba. Aparentemente, $z$ -se utilizan cuando se supone que el parámetro de dispersión es conocido y $t$ -se utilizan cuando se calcula el parámetro de dispersión (véase este enlace ).

¿Podría alguien explicar, por qué un $t$ -¿se utiliza a veces para una prueba de Wald aunque se suponga que la relación del coeficiente y su error estándar se distribuyen como normal estándar?

Editar después de que la pregunta fue contestada

Este puesto también aporta información útil a la pregunta.

26voto

Runcible Puntos 539

La salida de glm utilizando una distribución de Poisson da un $z$ -valor porque con una distribución de Poisson, la media y el parámetro de la varianza son iguales. En el modelo de Poisson, sólo hay que estimar un único parámetro ( $\lambda$ ). En un glm donde hay que estimar tanto una media y parámetro de dispersión, debería ver el $t$ -distribución utilizada.

Para una regresión lineal estándar, se supone que el término de error se distribuye normalmente. En este caso, hay que estimar el parámetro de la varianza, de ahí que se utilice el $t$ -para la estadística de la prueba. Si de alguna manera conociera la varianza poblacional del término de error, podría utilizar una $z$ -estadística de prueba en su lugar.

Como mencionas en tu post, la distribución de la prueba es asintóticamente normal. El $t$ -es asintóticamente normal, por lo que en una muestra grande, la diferencia sería insignificante.

4voto

JonBee Puntos 146

En el marco del MLG, en general, el W estadística de la prueba que usted mencionó es asintóticamente Normal distribuido, por eso se ve en R el z valores.

Además, cuando se trata de un modelo lineal, es decir, un MLG con una variable de respuesta de distribución normal, la distribución del estadístico de prueba es a T de los estudiantes Así que en R tienes t valores.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X