5 votos

En la regresión lineal, ¿hay algún significado para el término XTyXTy ?

Hace poco, me preguntaba sobre esta cuestión.

En un problema de regresión lineal estándar ( y=Xβy=Xβ y resolvemos para ββ ), la solución es β=X1yβ=X1y cuando XX es cuadrado e invertible, y (XTX)1XTy(XTX)1XTy cuando XX tiene rango de columna completo.

Sin embargo, me pregunto si hay alguna otra explicación para este término, por ejemplo, verlo como la covarianza inversa (XTX)1(XTX)1 multiplicado por XTyXTy . Entonces, me pregunto cuál es el significado para XTyXTy que lo convierte en una solución?

Parece que XTyXTy es sólo un vector de productos punto de cada vector de características y etiquetas ( yy ). No sé si hay una explicación mejor.

1 votos

Es de suponer, punto productos en lugar de doc ?

5voto

HyLian Puntos 2058

Intentaré explicarlo desde el punto de vista del álgebra lineal, pero no estoy seguro de que sea lo que necesitas.

En primer lugar, al resolver la ecuación en el caso del sistema inconsistente, sabemos que ˆy^y es la proyección ortogonal de yy en el espacio de columnas de XX . En otras palabras, ˆy^y puede estimarse mediante XˆβX^β . En segundo lugar, sabemos que cuando restamos yˆyy^y creamos la componente ortogonal, que es ortogonal al espacio de columnas de XX .

Además, sabemos que la ortogonalidad significa que si algún vector aa que es ortogonal al vector bb se multiplica por bb , dará 00 como resultado. Por último, para tener el espacio de columnas y no el de filas de la matriz XX necesitamos tomar la transposición de la misma.

Así, tenemos una ecuación XT(yXˆβ)=0XT(yX^β)=0

Al abrir los paréntesis y poner diferentes partes de la ecuación en los diferentes lados, recibimos la misma ecuación de la que has hablado.

ˆβ=(XTX)1XTy^β=(XTX)1XTy

2voto

Rob Allen Puntos 486

La gente a veces divide esa cantidad de forma diferente y la llama P=X(XTX)1XT el P a matriz de proyección, la matriz de influencia o la matriz del sombrero. Se puede pensar en la matriz de proyección como un mapeo entre la y y los previstos.

La matriz de proyección tiene una serie de propiedades útiles. En particular, la k elemento de su diagonal principal ( Pk,k ) contiene la puntuación de apalancamiento para el k Este dato puede ser una información útil para el diagnóstico.

2 votos

Ahora me haces pensar. ¿Qué significa la suma de la diagonal de la matriz de proyección?

4 votos

@horaceT La traza de la matriz del sombrero es el número de parámetros libres (f.d. del modelo). Esto se aplica a los modelos que se pueden escribir en la forma lineal ˆy=Ay que incluye muchos modelos que no son simples modelos de regresión lineal. Muchos suavizadores pueden escribirse de esta forma, por ejemplo.

2voto

Supongamos que tenemos un sistema lineal de m ecuaciones en xRn

Ax=b

ARm×n tiene rango de columna completo, y bRm . Multiplicando ambos lados por AT obtenemos un sistema lineal de nm ecuaciones en xRn

ATAx=ATb

que se suele conocer como "ecuaciones normales". Dado que A tiene rango de columna completo, la matriz cuadrada ATA es invertible. Por lo tanto, este último sistema lineal tiene la solución única (ATA)1ATb mientras que el sistema lineal original, Ax=b Puede que ni siquiera tenga una solución. Nótese que una solución de las "ecuaciones normales" no es necesariamente una solución del sistema lineal original.

Entonces, ¿cuál es el "significado" de ATb ? Es una proyección a escala de b en el espacio de columnas de A . El dimensión del lado derecho es reducido de mn à n para poder encontrar una solución única. Como las columnas de A no están necesariamente normalizados, la multiplicación a la izquierda por (ATA)1 proporciona la normalización necesaria.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X