22 votos

Relación entre la varianza y las distancias por pares dentro de una variable

Por favor, demuestre que si tenemos dos variables (con igual tamaño de muestra) $X$ y $Y$ y el desviación en $X$ es mayor que en $Y$ entonces el suma de diferencias al cuadrado (es decir, las distancias euclidianas al cuadrado) entre puntos de datos dentro de $X$ también es mayor que el de $Y$ .

1 votos

Por favor, aclare: Cuando dice desviación ¿quieres decir varianza de la muestra ? Cuando usted dice suma de diferencias al cuadrado ¿quieres decir $\sum_{i,j} (x_i - x_j)^2$ ?

9 votos

Asumiendo lo anterior: $$ \sum_{i,j} (x_i - x_j)^2 = \sum_{i \neq j} ((x_i - \bar{x}) - (x_j - \bar{x}))^2 = 2 n \sum_{i=1}^n (x_i - \bar{x})^2 \> , $$ mediante la contabilización cuidadosa de los elementos en el término cruzado. Me imagino que se pueden rellenar las (pequeñas lagunas). El resultado se obtiene entonces de forma trivial.

0 votos

Para un análisis más extenso de esta relación y sus aplicaciones, visite es.wikipedia.org/wiki/Variograma#Variograma_Empírico .

7voto

jldugger Puntos 7490

Sólo para dar una respuesta "oficial", para complementar las soluciones esbozadas en los comentarios, observe

  1. Ninguno de $\operatorname{Var} ((X_i))$ , $\operatorname{Var} ((Y_i))$ , $\sum_{i,j}(X_i-X_j)^2$ o $\sum_{i,j} (Y_i-Y_j)^2$ se modifican desplazando todos los $X_i$ uniformemente a $X_i-\mu$ para alguna constante $\mu$ o cambiar todo $Y_i$ a $Y_i-\nu$ para alguna constante $\nu$ . Por lo tanto, podemos suponer que estos cambios se han realizado para hacer $\sum X_i = \sum Y_i = 0$ De ahí que $\operatorname{Var}((X_i)) = \sum X_i^2$ y $\operatorname{Var}((Y_i)) = \sum Y_i^2$ .

  2. Tras eliminar los factores comunes de cada lado y utilizar (1), la pregunta pide que se demuestre que $\sum X_i^2 \ge \sum Y_i^2$ implica $\sum_{i,j} (X_i-X_j)^2 \ge \sum_{i,j} (Y_i-Y_j)^2$ .

  3. La simple expansión de los cuadrados y el reordenamiento de las sumas dan como resultado $$\sum_{i,j}(X_i-X_j)^2 = 2\sum X_i^2 - 2\left(\sum X_i\right)\left(\sum X_j\right) = 2\sum X_i^2 = 2\operatorname{Var}((X_i))$$ con un resultado similar para el $Y$ 's.

La prueba es inmediata.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X