18 votos

Media aritmética. ¿Por qué funciona?

He estado usando la fórmula para la media aritmética toda mi vida, pero no estoy seguro de por qué funciona.

Mi intuición actual es esta:

La media aritmética es un número que cuando se multiplica por el número de elementos, te da la suma de todos los elementos. Debido a este hecho, no puede ser más que el máximo ni menos que el mínimo, y debería estar situado más o menos en el centro.

Pero me preguntaba si existen otras intuiciones por ahí. ¿Por qué funciona esta fórmula? Si de paso pudieras hablar también sobre el promedio ponderado, eso también estaría bien.

Gracias

30 votos

¿Qué significa "¿Por qué funciona?" aquí...?

0 votos

Supongo que significa prueba. Pero como la fórmula es tan básica y elemental, tal vez no haya prueba. Quizás solo quiero tener una buena intuición.

2 votos

Tu pregunta es difícil de entender. "Supongo que significa prueba". No entiendo a qué te refieres con esto. ¿Prueba de qué? ¿Qué funciona?

42voto

mweiss Puntos 6697

La forma más sencilla de explicar la media aritmética es en términos de "reparto equitativo":

Abe tiene 12 galletas, Brianna tiene 8 galletas y Chuck tiene 7 galletas. Si las redistribuyeran para que todos tengan la misma cantidad, ¿cuántas les tocaría a cada uno?

Obviamente, la forma de responder a esta pregunta es encontrar la cantidad total de galletas ($12 + 8 + 7 = 27$) y luego dividir las galletas entre las tres personas ($27/3 = 9$). Eso es precisamente lo que hace el cálculo de la media aritmética.

¿Eso es lo que buscas?


Editado para agregar:

Aquí hay otro punto de vista que podría ayudar. Nos gustaría encontrar algún número $N$ que esté en "medio" del conjunto $\{12, 8, 7\}$ (usando los mismos números del ejemplo anterior). ¿Qué significa "en medio"? Bueno, una forma de interpretar esta frase vaga es imaginar que ya tuviéramos ese $N$ en la mano, y calculamos las tres cantidades $12-N, 8-N, 7-N$. Estas tres cantidades nos dicen qué tan lejos está $N$ de cada una de las tres piezas de información, a las que llamamos "desviaciones".

¿Qué pasa si elegimos mal a $N? Por ejemplo, si cada una de las tres desviaciones fuera positiva, eso significaría que $N$ es más pequeño que cada uno de los tres números originales, lo cual no queremos. Si cada una de las tres desviaciones fuera negativa, eso significaría que $N$ es más grande que cada uno de los tres números originales, nuevamente mal. Para que $N$ esté en el medio, quisiéramos que algunas de las desviaciones sean positivas y algunas negativas. De hecho, si pudiéramos elegir $N$ de manera que las desviaciones positivas cancelen exactamente las desviaciones negativas, entonces sentiríamos que realmente hemos encontrado el "medio".

Translatemos ahora eso a un cálculo. Queremos encontrar $N$ de tal manera que $$(12-N) + (8-N) + (7-N) = 0$$ Si piensas ahora en lo que tomaría resolver esta ecuación, te darás cuenta rápidamente de que terminarás sumando los tres números en tu conjunto de datos y luego dividiendo por 3.

1 votos

Me gusta mucho tu respuesta, pero ¿cómo representa "reparto igual" una 'tendencia central'? Gracias.

6 votos

El resultado que obtienes al redistribuir está destinado a estar en algún lugar intermedio, porque aquellos que tienen más acaban dando su excedente a aquellos que tienen menos.

0 votos

Wow. Gracias por la parte de edición, tiene mucho sentido. Me preguntaba cómo encaja esto con la ecuación del promedio ponderado. ¿Alguna idea? Muchas gracias.

28voto

Andrew Whitehouse Puntos 1353

Tomemos un paso atrás. Olvida todo lo que aprendiste sobre la media aritmética.


Imagina que tienes una lista de números. Una pregunta natural es: ¿cuál es el centro de esta lista?
Para responder eso, debes preguntarte: ¿qué es un "centro" en primer lugar?
¿Por qué, por ejemplo, 9 no es el centro de los números {1, 2, 4, 8}?

Si lo piensas por un momento, te darás cuenta de que el centro de una lista de números es el número $\bar x$ cuya distancia total de todos los números $x_k$ en la lista es mínima.
Así que eso significa que quieres minimizar $\sum_k \lVert x_k - \bar x \rVert$.

Pero, ¿cómo defines $\lVert x \rVert$? Una definición natural es $|x|$.
Cuando lo defines de esa manera, obtienes $\bar x = $ la mediana. ¿Por qué? Prueba un ejemplo sencillo en un papel para verlo visualmente: las penalizaciones del lado izquierdo y derecho se cancelan en la mediana:
introduce la descripción de la imagen aquí
También nota que cuando hay un número par de elementos, cualquier elemento en el intervalo que contiene los dos elementos intermedios es "una mediana". Sin embargo, al tomar un límite superior, puedes encontrar un único valor en lugar de un intervalo, que en este caso es 8/3.

Pero también puedes definir $\lVert x \rVert =|x|^2$. En ese caso, obtienes $\bar x = $ la media aritmética:
introduce la descripción de la imagen aquí

¿Por qué esta es la media aritmética? La fórmula para esto debería explicarlo:
Si tienes $\bar x = \arg \min_x \sum_k |x_k - x|^2$, entonces puedes igualar su derivada a cero:

$$\frac{d}{d\bar x}\sum_k |x_k - \bar x|^2 = 0$$ $$\sum_k 2 (x_k - \bar x) = 0$$ $$\sum_{k=1}^n x_k = n \bar x$$ $$\bar x = \frac{1}{n} \sum_{k=1}^n x_k$$

¿Has notado que esta es exactamente la media aritmética?

Esto es exactamente por qué la media aritmética es una medida pobre de la tendencia central.

Penaliza las desviaciones cuadráticamente en lugar de linealmente.
Sin embargo, es fácil de calcular (intenta lo mismo con la mediana para ver a qué me refiero), y tiene la propiedad agradable de que (por definición) multiplicarla por $n$ te da la suma total.
Así que la gente la usa de todos modos, incluso cuando no es la elección correcta.
Pero, ¿cuándo es la elección correcta?
Es la elección correcta cuando estás buscando la variable dependiente "promedio" en lugar de la variable independiente "promedio", por así decirlo.
Por ejemplo, si estás viendo la riqueza de la persona promedio, entonces necesitas mirar la riqueza mediana. Esto es -- por definición -- útil para entender cuán rica es la persona promedio. Pero si estás tratando de entender qué está sucediendo con la riqueza en sí misma en lugar de con las personas, es decir, quieres saber la riqueza promedio de una persona, entonces necesitas mirar la riqueza media.

Ahora, ¿qué pasa si vamos más lejos? Hemos intentado $\lVert x \rVert = |x|^1$ (la mediana) y $\lVert x \rVert = |x|^2$ (la media).

¿Qué pasa si intentamos $\lVert x \rVert = |x|^0$? Si lo hacemos, obtenemos de vuelta la moda, asumiendo que definimos $0^0$ como $0$ (debemos tomar un límite aquí para ver qué sucede):
introduce la descripción de la imagen aquí introduce la descripción de la imagen aquí

¿Qué pasa si intentamos $\lVert x \rVert = |x|^\infty$? En este caso, obtenemos de vuelta el punto medio -- es decir, el promedio de los valores mínimo y máximo (nuevamente, debemos tomar un límite para ver qué sucede):
introduce la descripción de la imagen aquí

Debería tener sentido por qué se dice que todos estos miden "tendencia central". :)

0 votos

"Sin embargo, es fácil de calcular (prueba lo mismo para la mediana para ver a qué me refiero)." La mediana se puede calcular en tiempo lineal al igual que la media es.wikipedia.org/wiki/Algoritmo_de_selección. Por supuesto, tienes razón en el sentido de que el algoritmo óptimo para la media es mucho más obvio.

5 votos

@DanBrumleve: Cuando dije "fácil" no me estaba refiriendo a la complejidad temporal. Simplemente estaba haciendo un punto práctico que también se aplicaba hace un siglo. La facilidad de cálculo es la misma razón por la que se utilizan otras técnicas como el ajuste de mínimos cuadrados. La informática es irrelevante aquí. Sin embargo, calcular la mediana es un problema computacional más difícil también. Nadie conoce un algoritmo para calcularla de forma secuencial utilizando espacio sublineal, por ejemplo, mientras que puedes calcular la media en línea con espacio logarítmico. Es de hecho un problema computacional más fácil.

2 votos

"Olvida todo lo que sabes sobre AM" y luego todo eso ...

11voto

k170 Puntos 5765

Gráfico de las medias aritmética, geométrica y Armónica

AMGMHM

La media aritmética y geométrica dentro de un semicírculo

AMGM

Media Aritmética

En la imagen anterior, la media aritmética encuentra el punto medio de la suma total porque está dividiendo entre dos. En otras palabras, está encontrando la mitad de la suma total porque solo hay dos valores en la suma.

En general, la media aritmética divide la suma total en partes iguales, independientemente de lo diferentes que sean cada uno de los valores. Esto se representa matemáticamente como $$ \overline{x}=\frac{1}{n}\sum_{k=1}^n x_k=\frac{1}{n}x_1+\frac{1}{n}x_2+\dots +\frac{1}{n}x_n $$ Entonces, por ejemplo, si queremos encontrar la media aritmética de $\{3, 60, 900\}$, entonces $$ \overline{x}=\frac{1}{3}\sum_{k=1}^3 x_k=\frac{1}{3}3+\frac{1}{3}60+\frac{1}{3}900=321 $$ Donde $321$ representa un tercio del valor de la suma. También observe que en casos como este, la media aritmética puede estar fuertemente influenciada por un valor que es mucho más grande o más pequeño que el resto. Por esta razón, la media aritmética no se considera una estadística robusta.

Media Ponderada

La media ponderada para los valores $\{x_1, x_2, \dots, x_n\}$ y los pesos $\{w_1, w_2, \dots, w_n\}$, se expresa matemáticamente como $$ \overline{x}=\frac{\sum_{k=1}^n w_kx_k}{\sum_{k=1}^n w_k}=\frac{w_1x_1+w_2x_2+\cdots +w_nx_n}{w_1+w_2+\cdots +w_n} $$ Entonces, para la media ponderada de $\{3, 60, 900\}$ con pesos $\left\{\frac{6}{9}, \frac{2}{9}, \frac{1}{9}\right\}$, tenemos $$ \overline{x}=\frac{\frac{6}{9}3+\frac{2}{9}60+\frac{1}{9}900}{\frac{6}{9}+ \frac{2}{9}+ \frac{1}{9}}=2+13.\overline{3}+100=115.\overline{3} $$ Observe que la media aritmética también se puede generalizar como una media ponderada donde cada valor tiene un peso igual de $\frac{1}{n}$. Como se ve en el ejemplo anterior, los pesos seleccionados pueden tener un gran impacto en el resultado.

6voto

Neil W Puntos 1728

La idea más simple detrás de esto podría ser una respuesta a la pregunta "si todos tuvieran una parte igual, ¿cuánto tendrían?"

La etimología de la palabra 'promedio' sugiere que este compartir es la idea fundamental, ya que llegó a tener su significado matemático actual al calcular la parte de cada parte en la pérdida cuando la carga se dañaba/perdía en el mar. La idea de promedio general describe el proceso de distribuir el valor de una pérdida marítima en proporción a la carga en riesgo. Por lo tanto, esto implica un cálculo promedio ponderado.

Por lo tanto, el hecho de que el promedio por el número de elementos sea igual al total, fue la motivación original para su cálculo.

3voto

marty cohen Puntos 33863

Bueno, es una media, por lo que su valor está entre el mínimo y el máximo, es analíticamente muy agradable (diferenciable, etc.), y es razonablemente fácil de calcular rápida y precisamente (ver Kahan).

También es la más simple de las medias de potencia ($p=1$).

Además, es amigable y lenta para enojarse, a diferencia de algunas medias medias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X