4 votos

Explicación de R-cuadrado como ratio de covarianzas y varianzas

Tengo un código que calcula $R^2$ con sumas $$R^2 = \frac{(\sum xy - \frac1n \sum x \sum y)^2}{(\sum x^2 - \frac1n \sum x \sum x) (\sum y^2 - \frac1n \sum y \sum y)},$$ lo que equivale a $$R^2 = \frac{cov(x, y) \cdot cov(x, y)}{var(x) \cdot var(y)}.$$

Sé que el código es correcto por la evaluación comparativa, pero nunca he visto esta forma. ¿Puede alguien explicar o proporcionar una referencia? Gracias.

Por cierto, el código está construido para la velocidad. Hace regresiones continuas y puede encontrar rápidamente cada suma diferenciando una suma acumulada.

3voto

Bryan Rehbein Puntos 3947

La correlación es la covarianza escalada por las DE, $r=\text{cor}(x,y)=\text{cov}(x,y)/[\text{SD}(x) \; \text{SD}(y)]$ . La fórmula que cita sigue inmediatamente. Una referencia parece innecesaria.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X