¿Cuál es la distribución de $\mathrm{tr}(AA'BB')$ donde $A$ y $B$ son dos matrices aleatorias de $d \times k$ tamaño con columnas ortonormales?
¿Quizás el valor esperado sea más fácil de calcular? Una solución alternativa sería utilizar una simulación. ¿Cuál sería el esquema más eficaz? Valores típicos para $d$ sería alrededor de 2000, mientras que $k$ oscila entre ~10 y algunos cientos.
A continuación, se explica con más detalle mi problema y su contexto, cómo acabé planteando esta pregunta y qué intenté.
Contexto
Quiero comprobar si las componentes principales calculadas a partir de una muestra de proceso estocástico han convergido. Mis ideas actuales consisten en comparar los subespacios abarcados por el primer $k$ componentes principales para determinados valores de interés de $k$ ya sea para varias realizaciones del proceso estocástico o para componentes principales bootstraped. Mi criterio para la similitud del subespacio es $\mathrm{tr}(AA'BB') / k$ donde $A$ y $B$ son matrices cuyo $k$ Las columnas son las bases de los dos subespacios a comparar. Este criterio es fácil de calcular y se comporta bien, salvo por la siguiente propiedad: a medida que la dimensión de los subespacios se acerca a la dimensión total, el espacio angular restante en el que señalar las direcciones "erróneas" se reduce. Para construir un criterio más significativo, pensé en comparar esta puntuación con la obtenida al comparar dos subespacios aleatorios de dimensión $k$ .
Mi intento
Mi primer intento fue considerar que, sin pérdida de generalidad, el primer subespacio aleatorio podría tener como base el primer $k$ vectores de la base canónica.
Se puede construir una base para el otro subespacio aleatorio eligiendo primero vectores de la base canónica sin reemplazo.
La distribución resultante sería simplemente la de una ley hipergeométrica con parámetro correspondiente a $k$ se extrae en un conjunto total de $d$ vectores entre los cuales $k$ dar un resultado positivo (el $k$ primeros vectores de la base canónica), donde $d$ es la dimensión del espacio total, $\mathrm{H}(d, k, k/d)$ .
Ahora bien, no hay ninguna razón para que los vectores de las dos bases estén alineados u ortogonales. Supongo que es posible remediarlo aplicando una rotación aleatoria $R$ y mira $\mathrm{tr}(AA'RBB'R')$ . No estoy seguro de cómo una rotación en $\mathbb{R}^d$ se comporta pero tal vez utilizando las propiedades de la traza y el hecho de que $R' = R^{-1}$ ¿es posible solucionar esto?
Nota: Los proyectores ortogonales aleatorios se distribuyen según la Distribución de Wishart . Sin embargo, no sé más sobre esto.
Referencias relacionadas:
-
Absil, Edelman & Koev, " Sobre el mayor ángulo principal entre subespacios aleatorios ", Linear Algebra and its Applications, 2006, doi:10.1016/j.laa.2005.10.004, (No he leído este)
-
Björck & Golub, " Métodos numéricos para calcular los ángulos entre subespacios lineales ", Mathematics of Computation, 1973
-
Ipsen & Meyer, " El ángulo entre subespacios complementarios ", The American Mathematical Monthly, 1995
-
Johnstone, " Análisis multivariante y conjuntos de Jacobi: Mayor valor propio, límites de Tracy-Widom y tasas de convergencia ", Ann. Statist., 2008 (demasiado esotérico para mí)
-
Liquet & Saracco, " Aplicación del enfoque Bootstrap a la elección de la dimensión y la $\alpha$ Parámetro en el {SIR} $\alpha$ Método ", Communications in Statistics Simulation and Computation, 2008
-
Wang, Wang & Feng, " Análisis de la distancia subespacial con aplicación al algoritmo bayesiano adaptativo para el reconocimiento facial ", Pattern Recognition , 2006
-
Zuccon, Azzopardi y van Rijsbergen, " Espacios semánticos: Medición de la distancia entre distintos subespacios ", 2009
-
Hotelling, " Relaciones entre dos conjuntos de variables ", Biometrika, 1936 (En los párrafos 11 y siguientes se dan pruebas posiblemente apropiadas en casos de baja dimensión y se extienden en el párrafo 15 a dimensiones más altas).
-
Bao, Hu, Pan y Zhou, " Prueba de independencia para vectores aleatorios de alta dimensión basada en la libertad de las matrices de correlación de bloques ", Revista Electrónica de Estadística, 2017