Processing math: 100%

29 votos

Prueba de la fórmula LOOCV

Desde Introducción al aprendizaje estadístico de James et al., la estimación de la validación cruzada con exclusión (LOOCV) se define como CV(n)=1nni=1MSEi donde MSEi=(yiˆyi)2 .

Sin prueba, la ecuación (5.2) afirma que para una regresión por mínimos cuadrados o polinómica (no sé si esto se aplica a la regresión sobre una sola variable), CV(n)=1nni=1(yiˆyi1hi)2 donde " ˆyi es el i valor ajustado del ajuste original por mínimos cuadrados ( ni idea de lo que significa esto, por cierto ¿Significa esto que el uso de todo de los puntos del conjunto de datos) y hi es el apalancamiento" que se define por hi=1n+(xiˉx)2nj=1(xjˉx)2.

¿Cómo se demuestra esto?

Mi intento: se podría empezar por notar que ˆyi=β0+ki=1βkXk+some polynomial terms of degree 2 pero aparte de esto (y si recuerdo, esa fórmula para hi sólo es cierto para la regresión lineal simple...), no estoy seguro de cómo proceder a partir de aquí.

27voto

Christoph Hanck Puntos 4143

Mostraré el resultado para cualquier regresión lineal múltiple, tanto si los regresores son polinomios de Xt o no. De hecho, muestra un poco más de lo que pedías, porque muestra que cada residuo LOOCV es idéntico al correspondiente residuo ponderado por apalancamiento de la regresión completa, no sólo que se puede obtener el error LOOCV como en (5.2) (podría haber otras formas en las que los promedios coinciden, aunque no cada término del promedio sea el mismo).

Permítanme tomarme la libertad de utilizar una notación ligeramente adaptada.

Primero demostramos que ˆβˆβ(t)=(ˆut1ht)(XX)1Xt,(A) donde ˆβ es la estimación utilizando todos los datos y ˆβ(t) la estimación al dejar fuera X(t) , observación t . Dejemos que Xt sea definido como un vector de filas tal que ˆyt=Xtˆβ . ˆut son los residuos.

La prueba utiliza el siguiente resultado algebraico matricial.

Dejemos que A sea una matriz no singular, b un vector y λ un escalar. Si λ1bA1b Entonces (A+λbb)1=A1(λ1+λbA1b)A1bbA1(B) 

La prueba de (B) se desprende inmediatamente de la comprobación de {A1(λ1+λbA1b)A1bbA1}(A+λbb)=I.

El siguiente resultado es útil para demostrar (A)

(X(t)X(t))1Xt=(11ht)(XX)1Xt. (C)

Prueba de (C): Por (B) tenemos, utilizando Tt=1XtXt=XX , (X(t)X(t))1=(XXXtXt)1=(XX)1+(XX)1XtXt(XX)11Xt(XX)1Xt. Así que encontramos (X(t)X(t))1Xt=(XX)1Xt+(XX)1Xt(Xt(XX)1Xt1Xt(XX)1Xt)=(11ht)(XX)1Xt.

La prueba de (A) se deduce ahora de (C): Como XXˆβ=Xy, tenemos (X(t)X(t)+XtXt)ˆβ=X(t)y(t)+Xtyt, o {Ik+(X(t)X(t))1XtXt}ˆβ=ˆβ(t)+(X(t)X(t))1Xt(Xtˆβ+ˆut). Así que, ˆβ=ˆβ(t)+(X(t)X(t))1Xtˆut=ˆβ(t)+(XX)1Xtˆut1ht, donde la última igualdad se deduce de (C).

Ahora bien, ten en cuenta ht=Xt(XX)1Xt . Multiplique a través de (A) por Xt , añada yt en ambos lados y reordenar para obtener, con ˆu(t) los residuos resultantes de utilizar ˆβ(t) ( ytXtˆβ(t) ), ˆu(t)=ˆut+(ˆut1ht)ht o ˆu(t)=ˆut(1ht)+ˆutht1ht=ˆut1ht

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X