10 votos

¿Cuál es la media?

Cuando me fue presentado por primera vez el concepto de promedio (media), estaba confundido. ¿Qué promedio de decir? ¿Cómo un número $\sum_{i=1}^{n} a_{i}$ representa a la "tendencia central" de un conjunto de puntos de datos $a_i$. Entonces, he encontrado una manera de lidiar con este concepto. Pensé que el promedio (media) es "el más cercano a todos los puntos de datos en el mismo tiempo".

Ahora, yo quiero probar esta. Concisa:

Vamos $f$ $:$ $\Bbb{R}$$\to$$\Bbb{R}$ se define por:

$$f(x) = \sum_{i=1}^{n}|x-a_i|$$

Para probar: $f(x)$ de aciertos mínimo en $x=\bar a$ donde $\bar a$ es la media de los puntos de datos discretos $a_i$. Esto significaría que la suma de las distancias de la media de los distintos puntos de datos es mínimo en comparación con cualquier otro número.

Mi intento: Claramente $f(x)$ es continua ya que se trata de una suma de funciones continuas y pieza de sabios diferenciables ya que se trata de una suma de tales funciones.

Así, me encuentro a $f'(x)$. Antes de eso, vamos a suponer $a_1<a_2<\ldots<a_n$ [claramente, sin pérdida de generalidad, aquí]:

$$ f'(x) = \begin{cases} -n, & \text {%#%#%} \\ -n+2, & \text{%#%#%} \\ -n+4, & \text{%#%#%} \\ . & . \\ . & . \\ . & . \\ -n+2n = n, & \text{%#%#%} \\ \end{casos} $$

Ahora, el problema que surge es: $x<a_1$ no tiene soluciones para $a_1<x<a_2$ es impar. Para n es par, se tiene la solución como un todo el intervalo:

$a_2<x<a_3$$

Esto significa que he fallado, mi intuición fue mal desde el principio. Se puede demostrar [creo] que para $a_{n-1}<x<a_n$ es incluso, $f'(x)=0$ se encuentra en el citado intervalo, pero aún así: Esto significa que hay más números reales que son tanto la "media" de los puntos de datos como la media de sí mismo [si mi "definición" se fue a la derecha].

Así, dos preguntas:

  • ¿Por qué mi intuición mal?
  • Que la intuición es el adecuado para los promedios (media)?

10voto

Yves Daoust Puntos 30126

Su intento es excelente, pero te va a llevar al éxito.

En realidad, el mínimo de

$$f_1(x) := \sum_{i=1}^{n}|x-a_i|$$

es conocido por ser alcanzado por la mediana, otro estimador de la tendencia central.

(La mediana se define como el valor de la fila $n/2$ o el promedio de los dos valores de la fila $(n\pm1)/2$; para, incluso,$n$, todos los valores entre los dos medios, incluyendo la mediana, alcanzar el mínimo.)

En cambio, el promedio alcanza el mínimo de

$$f_2(x) := \sum_{i=1}^{n}(x-a_i)^2,$$ como se muestra por la cancelación de la derivada:

$$\frac12\dfrac{f_2(x)}{dx} = \sum_{i=1}^{n}(x-a_i)=nx-\sum_{i=1}^{n}a_i=0.$$

Por lo que el promedio es la solución de las ecuaciones $x=a_i$ en el de los mínimos cuadrados sentido. Es más sensible que la media a los valores, debido a que el cuadrado de la ponderación.

Por el bien de la comparación, el gráfico muestra el $f_1(x)/4$ $\sqrt{f_2(x)/4}$ de los puntos de $1, 3, 4, 7$.

enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X