Una formulación común de multinivel/jerárquica de los modelos de regresión es $y = Xb + Zc + e$ donde $X$ $n \times p$ matriz de $p$ nivel individual predictores, $Z$ $n \times q$ matriz de $q$ nivel de grupo de predictores, $y$ $n \times 1$ vector de observaciones en el nivel individual y $e$ es el término de error. Supongamos que hay $J$ grupos y el $q$ nivel de grupo de predictores son continuos. Me gustaría entender cómo construir un diseño completo de la matriz a partir de esta formulación, por ejemplo, para aplicar un gradiente de descenso algoritmo de optimización.
Es esta formulación equivalente a un diseño de la matriz construida como: $p$ columnas para el nivel individual de los predictores, $J$ columnas de variables indicadoras para la $J$ grupos (variando intercepta), $pJ$ columnas para la interacción entre el grupo de indicadores y el nivel individual de los predictores (variables de pistas), y $q$ columnas para el nivel de grupo de predictores (es decir, las columnas con valores repetidos por dentro-grupo de observaciones).
Hay formas alternativas de construir el diseño de la matriz cuando el número de grupos es grande ($J>10000$) para reducir el número de parámetros?