Esta pregunta trata de la estimación por máxima verosimilitud restringida (REML) en una versión particular del modelo lineal, a saber:
Y=X(α)β+ϵ,ϵ∼Nn(0,Σ(α)),
donde X(α) es un ( n×p ) parametrizada por α∈Rk , tal y como está Σ(α) . β es un vector desconocido de parámetros molestos; lo que interesa es estimar α y tenemos k≤p≪n . Estimar el modelo por máxima verosimilitud no es un problema, pero quiero utilizar REML. Es bien conocido, véase por ejemplo LaMotte que la probabilidad A′Y , donde A es cualquier matriz semiortogonal tal que A′X=0 se puede escribir
LREML(α∣Y)∝|X′X|1/2|Σ|−1/2|X′Σ−1X|−1/2exp{−12r′Σ−1r},r=(I−X(X′Σ−1X)+X′Σ−1)Y,
cuando X es el rango de la columna completa .
Mi problema es que para algunos perfectamente razonable, y científicamente interesante, α la matriz X(α) no es de rango de columna completo. Todas las derivaciones que he visto de la probabilidad restringida anterior hacen uso de igualdades determinantes que no son aplicables cuando |X′X|=0 es decir, asumen el rango de columna completo de X . Esto significa que la probabilidad restringida anterior sólo es correcta para mi ajuste en partes del espacio de parámetros, y por lo tanto no es lo que quiero optimizar.
Pregunta: ¿Existen probabilidades restringidas más generales, derivadas, en la literatura estadística o en otros lugares, sin la suposición de que X ¿se trata de un rango de columna completo? Si es así, ¿qué aspecto tienen?
Algunas observaciones:
- Derivar la parte exponencial no es un problema para cualquier X(α) y se puede escribir en términos de la inversa de Moore-Penrose como se ha indicado anteriormente
- Las columnas de A son una base ortonormal (cualquiera) para C(X)⊥
- Para los conocidos A la probabilidad de A′Y puede escribirse fácilmente para cada α pero, por supuesto, el número de vectores base, es decir, de columnas, en A depende del rango de la columna de X
Si alguien interesado en esta cuestión cree que la parametrización exacta de X,Σ ayudaría, hágamelo saber y los anotaré. En este momento, sin embargo, estoy principalmente interesado en un REML para un general X de las dimensiones correctas.
A continuación se ofrece una descripción más detallada del modelo. Dejemos que yt=μ+Ayt−1+vt,t=1,…,T ser un r -Autoregresión vectorial de primer orden [VAR(1)] donde vtiid∼N(0,Ω) . Supongamos que el proceso se inicia en algún valor fijo y0 en el momento t=0 .
Definir Y=[y′1,…,y′T]′ . El modelo puede escribirse en la forma de modelo lineal Y=Xβ+ε utilizando las siguientes definiciones y notación:
\begin{align} X &= [1_T \otimes I_r, C^{-1}B] \\ \beta &= [\mu', y_0' - \mu']' \\ \mathrm{var}(\varepsilon)^{-1} &= C'(I_T \otimes \Omega^{-1})C \\ C &= [Ir00⋯−AIr0⋯0−AIr⋯⋮⋮⋮⋱] \\ B &= e_{1, T} \N a veces A, \fin
donde 1T denota una T− vector dimensional de unos y e1,T el primer vector base estándar de RT .
Denote α=vec(A) . Tenga en cuenta que si A no es de rango completo entonces X(α) no es un rango de columna completo. Esto incluye, por ejemplo, los casos en los que uno de los componentes de yt no depende del pasado.
La idea de estimar VARs usando REML es bien conocida, por ejemplo, en la literatura de regresiones predictivas (ver por ejemplo Phillips y Chen y sus referencias).
Quizá convenga aclarar que la matriz X no es una matriz de diseño en el sentido habitual, simplemente se sale del modelo y a menos que haya a priori conocimiento sobre A no hay, hasta donde yo sé, ninguna forma de reparametrizarlo para que sea de rango completo.
He publicado una pregunta en math.stackexchange que está relacionada con ésta en el sentido de que una respuesta a la pregunta matemática puede ayudar a derivar una probabilidad que responda a esta pregunta.