13 votos

Intervalo de confianza para diferencia de medias en regresión

Supongamos que tengo un modelo de regresión cuadrática $$ Y = \beta_0 + \beta_1 X + \beta_2 X^2 + \epsilon $$ con los errores de $\epsilon$ la satisfacción de los habituales supuestos (independiente, normal, independiente de la $X$ valores). Deje $b_0, b_1, b_2$ ser el menor de los cuadrados de las estimaciones.

Tengo dos nuevos $X$ valores $x_1$$x_2$, y estoy interesado en obtener un intervalo de confianza para $v = E(Y|X = x_2) - E(Y|X=x_1) = \beta_1 (x_2 - x_1) + \beta_2 (x_2^2 - x_1^2)$.

La estimación puntual de la es $\hat{v} = b_1 (x_2 - x_1) + b_2 (x_2^2 - x_1^2)$, y (corríjanme si estoy equivocado) me puede hacer una estimación de la varianza por $$\hat{s}^2 = (x_2 - x_1)^2 \text{Var}(b_1) + (x_2^2 - x_1^2)^2 \text{Var}(b_2) + 2 (x_2 - x_1)(x^2 - x_1^2)\text{Cov}(b_1, b_2)$$ utilizando la varianza y la covarianza de las estimaciones de los coeficientes proporcionados por el software.

Yo podría usar una aproximación normal y tome $\hat{v} \pm 1.96 \hat{s}$ intervalo de confianza 95% para $v$, o yo podría utilizar un intervalo de confianza bootstrap, pero hay una manera de trabajar el importe exacto de la distribución y el uso que?

Gracias.

11voto

Nathan Long Puntos 30303

El resultado general que está buscando (bajo las suposiciones) se parece a esto: Para la regresión lineal con $p$ variables predictoras (tiene dos, $X$$X^2$) y una intercepción, luego con $n$ observaciones, $\mathbf{X}$ $n \times (p+1)$ diseño de la matriz, $\hat{\beta}$ $p+1$ dimensiones estimador de e $a \in \mathbb{R}^{p+1}$

$$ \frac{a^T\hat{\beta} - ^T \beta}{\hat{\sigma} \sqrt{a^T(\mathbf{X}^T\mathbf{X})^{-1}}} \sim t_{n-p-1}.$$

La consecuencia es que se pueden construir intervalos de confianza para cualquier combinación lineal de las $\beta$ vector utilizando el mismo $t$-distribución que utiliza para construir un intervalo de confianza para una de las coordenadas.

En su caso, $p = 2$$a^T = (0, x_2 - x_1, x_2^2 - x_1^2)$. El denominador en la fórmula de arriba, es la raíz cuadrada de lo que compute como la estimación del error estándar (a condición de que esto es lo que el software calcula ...). Tenga en cuenta que la varianza del estimador, $\hat{\sigma}^2$, que se supone será el (la habitual) estimador imparcial, donde se divide por los grados de libertad, $n-p-1$, y no el número de observaciones $n$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X