Vamos a mostrar el resultado para el caso general de que su fórmula para el estadístico de prueba es un caso especial. En general, tenemos que comprobar que la estadística puede ser, de acuerdo a la caracterización de la FF distribución, ser escrito como la proporción de independientes χ2χ2 r.v.s dividida por sus grados de libertad.
Deje H0:R′β=rH0:R′β=r RR rr conocido, aleatoria y R:k×qR:k×q total columna de rango de qq. Esto representa el qq lineal restricciones para (a diferencia de la OPs en la notación) kk regresores incluidos el término constante. Así, en @user1627466 ejemplo, p−1p−1 corresponde a la q=k−1q=k−1 restricciones de configuración de todos los coeficientes de pendiente a zerol.
En vista de Var(ˆβols)=σ2(X′X)−1Var(^βols)=σ2(X′X)−1, tenemos
R′(ˆβols−β)∼N(0,σ2R′(X′X)−1R),
así que (con B−1/2={R′(X′X)−1R}−1/2 ser una "matriz de la raíz cuadrada" de B−1={R′(X′X)−1R}−1, a través de, por ejemplo, una descomposición de Cholesky)
n:=B−1/2σR′(ˆβols−β)∼N(0,Iq),
como
Var(n)=B−1/2σR′Var(ˆβols)RB−1/2σ=B−1/2σσ2BB−1/2σ=I
donde la segunda línea se utiliza la varianza de la OLSE.
Este, como se muestra en la respuesta de que el vínculo (ver también aquí), es independiente de la d:=(n−k)ˆσ2σ2∼χ2n−k,
donde ˆσ2=y′MXy/(n−k) es el habitual insesgados de varianza de error de la estimación, con MX=I−X(X′X)−1X′ es el "residual maker matriz" de la regresión en X.
Así que, como n′n es una forma cuadrática en las normales,
∼χ2q⏞n′n/qd/(n−k)=(ˆβols−β)′R{R′(X′X)−1R}−1R′(ˆβols−β)/qˆσ2∼Fq,n−k.
En particular, en H0:R′β=r, esto se reduce a la estadística
F=(R′ˆβols−r)′{R′(X′X)−1R}−1(R′ˆβols−r)/qˆσ2∼Fq,n−k.
Por ejemplo, consideremos el caso especial R′=I, r=0, q=2, ˆσ2=1 y X′X=I. A continuación,
F=ˆβ′olsˆβols/2=ˆβ2ols,1+ˆβ2ols,22,
la distancia Euclídea al cuadrado de la estimación OLS desde el origen normalizado por el número de elementos, destacando que, desde ˆβ2ols,2 son cuadrados estándar normales y, por tanto,χ21, F distribución puede ser visto como un "promedio χ2 distribución.
En caso de que prefiera un poco de simulación (que por supuesto no es una prueba de ello!), en la que el valor null es prueba de que ninguno de los k regresores de la materia - que de hecho no, de manera que podemos simular la nula distribución.
![enter image description here]()
Vemos a un muy buen acuerdo entre los teóricos de la densidad y el histograma de Monte Carlo de la estadística de prueba.
library(lmtest)
n <- 100
reps <- 20000
sloperegs <- 5
critical.value <- qf(p = .95, df1 = sloperegs, df2 = n-sloperegs-1)
Fstat <- rep(NA,reps)
for (i in 1:reps){
y <- rnorm(n)
X <- matrix(rnorm(n*sloperegs), ncol=sloperegs)
reg <- lm(y~X)
Fstat[i] <- waldtest(reg, test="F")$F[2]
}
mean(Fstat>critical.value)
hist(Fstat, breaks = 60, col="lightblue", freq = F, xlim=c(0,4))
x <- seq(0,6,by=.1)
lines(x, df(x, df1 = sloperegs, df2 = n-sloperegs-1), lwd=2, col="purple")
Para ver que las versiones de la prueba estadística de la pregunta y la respuesta son de hecho equivalentes, tenga en cuenta que el valor null corresponde a las restricciones de R′=[0I]r=0.
Deje X=[X1X2] ser dividido según la cual los coeficientes se limita a ser cero en el null (en su caso, todas excepto la constante, pero la derivación a seguir es general). También, vamos a ˆβols=(ˆβ′ols,1,ˆβ′ols,2)′ ser la adecuada con particiones estimación OLS.
A continuación,
Rˆβols=ˆβols,2
y
R′(X′X)−1R≡˜D,
la parte inferior derecha del bloque de
(XTX)−1=(X′1X1X′1X2X′2X1X′2X2)−1≡(˜A˜B˜C˜D)
Ahora, el uso de los resultados para particiones inversos para obtener
˜D=(X′2X2−X′2X1(X′1X1)−1X′1X2)−1=(X′2MX1X2)−1
donde MX1=I−X1(X′1X1)−1X′1.
Por lo tanto, el numerador de la F estadística se convierte en (sin la división por q)
Fnum=ˆβ′ols,2(X′2MX1X2)ˆβols,2
Siguiente, recordemos que por la Frisch-Waugh-Lovell teorema podemos escribir
ˆβols,2=(X′2MX1X2)−1X′2MX1y
así que
Fnum=y′MX1X2(X′2MX1X2)−1(X′2MX1X2)(X′2MX1X2)−1X′2MX1y=y′MX1X2(X′2MX1X2)−1X′2MX1y
Queda por demostrar que esta numerador es idéntica a USSR−RSSR, la diferencia en la restringidas y no restringidas suma de los cuadrados de los residuos.
Aquí,
RSSR=y′MX1y
es la suma residual de los cuadrados de la regresión de yX1, es decir, con H0 impuesto. En su caso particular, esto es sólo TSS=∑i(yi−ˉy)2, los residuos de una regresión en una constante.
Utilizando de nuevo FWL (que también muestra que los residuos de los dos enfoques son idénticos), podemos escribir la USSR (SSR en su notación) como la SSR de la regresión
MX1yenMX1X2
Es decir,
USSR=y′M′X1MMX1X2MX1y=y′M′X1(I−PMX1X2)MX1y=y′MX1y−y′MX1MX1X2((MX1X2)′MX1X2)−1(MX1X2)′MX1y=y′MX1y−y′MX1X2(X′2MX1X2)−1X′2MX1y
Por lo tanto,
RSSR−USSR=y′MX1y−(y′MX1y−y′MX1X2(X′2MX1X2)−1X′2MX1y)=y′MX1X2(X′2MX1X2)−1X′2MX1y