9 votos

¿Cómo probar si las pendientes en el modelo lineal son iguales a un valor fijo?

Supongamos que tenemos un modelo de regresión lineal simple $Z = aX + bY$ y nos gustaría probar la hipótesis nula $H_0: a=b=\frac{1}{2}$ frente a la alternativa general.

Creo que se puede usar la estimación de $\hat{a}$ y $SE(\hat{a})$ y luego aplicar una prueba $Z$ para obtener el intervalo de confianza alrededor de $\frac{1}{2}$. ¿Está bien?

La otra pregunta está fuertemente relacionada con esta. Supongamos que tenemos una muestra $\{(x_1,y_1,z_1),\ldots ,(x_n,y_n,z_n) \}$ y calculamos las estadísticas de $\chi^2$

\begin{equation} \sum_{i=1}^n \frac{(z_i-\frac{x_i+y_i}{2})^2}{\frac{x_i+y_i}{2}}. \end{equation} ¿Se pueden usar estas estadísticas para probar la misma hipótesis nula?

9voto

Derek Swingley Puntos 3851

Puedes probar esta hipótesis con una prueba de modelo completo versus reducido. Aquí te explicamos cómo hacerlo. Primero, ajusta el modelo $Z = aX + bY$ y obtén los residuos de ese modelo. Eleva al cuadrado los residuos y sumalos. Esto es la suma de errores cuadrados para el modelo completo. Llamémosle $SSE_f$. A continuación, calcula $Z - \hat{Z}$ donde $\hat{Z} = 1/2*X + 1/2*Y$. Estos son tus residuos bajo la hipótesis nula. Eleva al cuadrado y sumalos. Esto es la suma de errores cuadrados para el modelo reducido. Llamémosle $SSE_r$.

Ahora calcula:

F = $((SSE_r - SSE_f)/2) / (SSE_f / (n-2))$,

donde $n$ es el tamaño de la muestra. Bajo $H_0$, esta estadística F sigue una distribución F con $2$ y $n-2$ grados de libertad.

Aquí tienes un ejemplo usando R:

x <- rnorm(n)
y <- rnorm(n)
z <- 1/2*x + 1/2*y + rnorm(n) ### nota que estoy simulando bajo H0 aquí

res <- lm(z ~ x + y - 1)
summary(res)
SSE.f <- sum(resid(res)^2)

zhat  <- 1/2*x + 1/2*y
SSE.r <- sum((z-zhat)^2)

F <- ((SSE.r - SSE.f) / 2) / (SSE.f / (n-2))
pf(F, 2, n-2, lower.tail=FALSE) ### este es el valor p

Rechaza la hipótesis nula si el valor p es inferior a .05 (si tu $\alpha$ es de hecho .05).

Supongo que realmente querías que tu modelo no contenga una constante. En otras palabras, supongo que realmente estás trabajando con el modelo $Z = aX + bY$ y no $Z = c + aX + bY$.

8voto

jldugger Puntos 7490

En la regresión lineal, la suposición es que $X$ e $Y$ no son variables aleatorias. Por lo tanto, el modelo

$$Z = a X + b Y + \epsilon$$

es algebraicamente lo mismo que

$$Z - \frac{1}{2} X - \frac{1}{2} Y = (a - \frac{1}{2})X + (b - \frac{1}{2})Y + \epsilon = \alpha X + \beta Y + \epsilon.$$

Aquí, $\alpha = a - \frac{1}{2}$ y $\beta = b - \frac{1}{2}$. El término de error $\epsilon$ no se ve afectado. Ajusta este modelo, estimando los coeficientes como $\hat{\alpha}$ y $\hat{\beta}$ respectivamente, y prueba la hipótesis $\alpha = \beta = 0$ de la manera habitual.


La estadística escrita al final de la pregunta no es una estadística chi-cuadrada, a pesar de su similitud formal con una. Una estadística chi-cuadrada involucra conteos, no valores de datos, y debe tener valores esperados en su denominador, no covariables. Es posible que uno o más de los denominadores $\frac{x_i+y_i}{2}$ sean cero (o cercanos a cero), lo cual muestra que algo está seriamente mal con esta formulación. Si eso no es convincente, considera que las unidades de medida de $Z$, $X$ e $Y$ podrían ser cualesquiera (como dracmas, parsecs y pecks), por lo que una combinación lineal como $z_i - (x_i+y_i)/2$ es (en general) sin sentido. No prueba nada.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X