Tengo un problema con la derivación completa de la distribución condicional de los coeficientes de regresión en un simple Bayesiano de regresión. El origen de las siguientes ecuaciones es:
- Lynch (2007). Introducción la aplicación de la Estadística Bayesiana y de Estimación para los Científicos Sociales, página 170 y 171.
La distribución posterior (con el uniforme de los priores de todos los parámetros) está dada por: P(βσ|X,Y)∝(σ2)−(n/2+1)exp{−12σ2(Y−Xβ)T(Y−Xβ)}
Por tanto, el pleno de la distribución condicional del coeficiente de β sólo requiere que el kernel: exp{−12σ2(Y−Xβ)T(Y−Xβ)} donde β p dimensiones vector de parámetros X n×p predictor de la matriz y Y n dimensiones del vector de respuestas.
Esto puede ser ampliado a: exp{−12σ2[YTY−YTXββTXTY+βTXTXβ]}
Puesto que Y es constante con respecto a β, que se puede quitar y el centro de los dos términos pueden ser agrupados juntos. Esto conduce a: exp{−12σ2[βTXTXβ−2βTXTY]} El siguiente paso que me confunde. El autor se multiplica toda la ecuación por (XTX)(XTX)−1. El problema no es la multiplicación de sí mismo. Sus autores resultado: exp{12σ2XTX)−1[βTβ−2βT(XTX)−1(XTY)]} Lo que es confuso para mí es la multiplicación dentro de los corchetes. Para mí pre-multiplicando por (XTX)−1 conduce a: (XTX)−1βTXTXβ−2(XTX)−1βTXTY
¿Por qué se permitió a los términos de intercambio βT(XTX)−1?
Desde βTXTXβ le da un valor escalar y multiplicando por (XTX)−1 resultados en una matriz cuadrada, este no es el mismo que βT(XTX)−1(XTX)β. Pero el autor parece ignorar esta en su solución. Lo que me estoy perdiendo?
Editar
Aquí está una foto de las páginas pertinentes: