Estoy leyendo este documento: Alineación de caras mediante regresión explícita de formas .
Uno de los pasos significativos del algoritmo que se propone en este documento está relacionado con la correlación. Pero mis conocimientos sobre la teoría de la probabilidad son extremadamente limitados.
Necesito calcular $cor((f_i - f_j), y)$ para $i, j \in [1..N]$
donde $cor(a, b)$ - correlación de dos variables aleatorias (no sé qué símbolo se utiliza para denotar la correlación), $f_i \in \{f_1, f_2, ..... f_N\}$ - conjunto de variables aleatorias, $y$ - alguna variable aleatoria. Para cada variable aleatoria tengo un conjunto de medidas por lo que parece que puedo estimar la expectativa y la varianza
Por supuesto que de manera grosera necesito computar $O(N^2)$ correlaciones. Pero el documento dice (parte 2.4. "Correlation-based feature selection") que puedo reducir la complejidad a $O(N)$ porque
La correlación entre un escalar y y una característica de diferencia de píxeles $(f_i f_j)$ puede representarse como la función de tres términos: $cov(f_i, f_j)$ , $cov(y, f_i)$ , y $cov(y, f_j)$ .
De la wikipedia sé que puedo representar $cov((f_i - f_j), y) $ como $cov(f_i, y) - cov(f_j, y)$ y tratando de calcular la correlación.
Pero no puedo derivar por qué necesito $cov(f_i, f_j)$ .
Entonces, ¿cómo puedo representar la correlación de las cosas anteriores?
P.D. Perdón por mi pobre nivel de inglés y matemáticas