El similitud del coseno entre dos vectores $a$ y $b$ es sólo el ángulo entre ellos $$\cos\theta = \frac{a\cdot b}{\lVert{a}\rVert \, \lVert{b}\rVert}$$ En muchas aplicaciones que utilizan la similitud del coseno, los vectores son no negativos (por ejemplo, un vector de frecuencia de términos para un documento), y en este caso la similitud del coseno también será no negativa.
Para un vector $x$ el " $z$ -El vector "puntuación" se definiría normalmente como $$z=\frac{x-\bar{x}}{s_x}$$ donde $\bar{x}=\frac{1}{n}\sum_ix_i$ y $s_x^2=\overline{(x-\bar{x})^2}$ son la media y la desviación estándar de $x$ . Así que $z$ tiene una media de 0 y una desviación estándar de 1, es decir $z_x$ es el estandarizado versión de $x$ .
Para dos vectores $x$ y $y$ su coeficiente de correlación sería $$\rho_{x,y}=\overline{(z_xz_y)}$$
Ahora bien, si el vector $a$ tiene media cero, entonces su varianza será $s_a^2=\frac{1}{n}\lVert{a}\rVert^2$ por lo que su vector unitario y su puntuación z estarán relacionados por $$\hat{a}=\frac{a}{\lVert{a}\rVert}=\frac{z_a}{\sqrt n}$$
Así que si los vectores $a$ y $b$ están centrados (es decir, tienen media cero), entonces su similitud del coseno será la misma que su coeficiente de correlación.
TL;DR La similitud del coseno es un producto punto de vectores unitarios. La correlación de Pearson es la similitud del coseno entre vectores centrados. La "transformada Z" de un vector es el vector centrado escalado a una norma de $\sqrt n$ .