Una formulación común de multinivel/jerárquica de los modelos de regresión es y=Xb+Zc+e donde X n×p matriz de p nivel individual predictores, Z n×q matriz de q nivel de grupo de predictores, y n×1 vector de observaciones en el nivel individual y e es el término de error. Supongamos que hay J grupos y el q nivel de grupo de predictores son continuos. Me gustaría entender cómo construir un diseño completo de la matriz a partir de esta formulación, por ejemplo, para aplicar un gradiente de descenso algoritmo de optimización.
Es esta formulación equivalente a un diseño de la matriz construida como: p columnas para el nivel individual de los predictores, J columnas de variables indicadoras para la J grupos (variando intercepta), pJ columnas para la interacción entre el grupo de indicadores y el nivel individual de los predictores (variables de pistas), y q columnas para el nivel de grupo de predictores (es decir, las columnas con valores repetidos por dentro-grupo de observaciones).
Hay formas alternativas de construir el diseño de la matriz cuando el número de grupos es grande (J>10000) para reducir el número de parámetros?