Tomemos un paso atrás. Olvida todo lo que aprendiste sobre la media aritmética.
Imagina que tienes una lista de números. Una pregunta natural es: ¿cuál es el centro de esta lista?
Para responder eso, debes preguntarte: ¿qué es un "centro" en primer lugar?
¿Por qué, por ejemplo, 9 no es el centro de los números {1, 2, 4, 8}?
Si lo piensas por un momento, te darás cuenta de que el centro de una lista de números es el número $\bar x$ cuya distancia total de todos los números $x_k$ en la lista es mínima.
Así que eso significa que quieres minimizar $\sum_k \lVert x_k - \bar x \rVert$.
Pero, ¿cómo defines $\lVert x \rVert$? Una definición natural es $|x|$.
Cuando lo defines de esa manera, obtienes $\bar x = $ la mediana. ¿Por qué? Prueba un ejemplo sencillo en un papel para verlo visualmente: las penalizaciones del lado izquierdo y derecho se cancelan en la mediana:
![introduce la descripción de la imagen aquí]()
También nota que cuando hay un número par de elementos, cualquier elemento en el intervalo que contiene los dos elementos intermedios es "una mediana". Sin embargo, al tomar un límite superior, puedes encontrar un único valor en lugar de un intervalo, que en este caso es 8/3.
Pero también puedes definir $\lVert x \rVert =|x|^2$. En ese caso, obtienes $\bar x = $ la media aritmética:
![introduce la descripción de la imagen aquí]()
¿Por qué esta es la media aritmética? La fórmula para esto debería explicarlo:
Si tienes $\bar x = \arg \min_x \sum_k |x_k - x|^2$, entonces puedes igualar su derivada a cero:
$$\frac{d}{d\bar x}\sum_k |x_k - \bar x|^2 = 0$$ $$\sum_k 2 (x_k - \bar x) = 0$$ $$\sum_{k=1}^n x_k = n \bar x$$ $$\bar x = \frac{1}{n} \sum_{k=1}^n x_k$$
¿Has notado que esta es exactamente la media aritmética?
Esto es exactamente por qué la media aritmética es una medida pobre de la tendencia central.
Penaliza las desviaciones cuadráticamente en lugar de linealmente.
Sin embargo, es fácil de calcular (intenta lo mismo con la mediana para ver a qué me refiero), y tiene la propiedad agradable de que (por definición) multiplicarla por $n$ te da la suma total.
Así que la gente la usa de todos modos, incluso cuando no es la elección correcta.
Pero, ¿cuándo es la elección correcta?
Es la elección correcta cuando estás buscando la variable dependiente "promedio" en lugar de la variable independiente "promedio", por así decirlo.
Por ejemplo, si estás viendo la riqueza de la persona promedio, entonces necesitas mirar la riqueza mediana. Esto es -- por definición -- útil para entender cuán rica es la persona promedio. Pero si estás tratando de entender qué está sucediendo con la riqueza en sí misma en lugar de con las personas, es decir, quieres saber la riqueza promedio de una persona, entonces necesitas mirar la riqueza media.
Ahora, ¿qué pasa si vamos más lejos? Hemos intentado $\lVert x \rVert = |x|^1$ (la mediana) y $\lVert x \rVert = |x|^2$ (la media).
¿Qué pasa si intentamos $\lVert x \rVert = |x|^0$? Si lo hacemos, obtenemos de vuelta la moda, asumiendo que definimos $0^0$ como $0$ (debemos tomar un límite aquí para ver qué sucede):
![introduce la descripción de la imagen aquí]()
¿Qué pasa si intentamos $\lVert x \rVert = |x|^\infty$? En este caso, obtenemos de vuelta el punto medio -- es decir, el promedio de los valores mínimo y máximo (nuevamente, debemos tomar un límite para ver qué sucede):
![introduce la descripción de la imagen aquí]()
Debería tener sentido por qué se dice que todos estos miden "tendencia central". :)
30 votos
¿Qué significa "¿Por qué funciona?" aquí...?
0 votos
Supongo que significa prueba. Pero como la fórmula es tan básica y elemental, tal vez no haya prueba. Quizás solo quiero tener una buena intuición.
2 votos
Tu pregunta es difícil de entender. "Supongo que significa prueba". No entiendo a qué te refieres con esto. ¿Prueba de qué? ¿Qué funciona?
6 votos
Supongamos que eres la persona que ideó esta fórmula. ¿Qué proceso de pensamiento ocurrió?
0 votos
No olvides la mediana, que también funciona. archive.org/details/HowToLieWithStatistics
0 votos
@David Esa es una mejor forma de decirlo.
3 votos
¿Qué quieres decir con "trabajo"? ¿Qué te preguntas por qué logra? La mejor suposición que se me ocurre es que te preguntas por qué al multiplicarlo por el número de elementos obtienes la suma de los elementos, pero no creo que sea eso, porque eso es obvio a partir de la fórmula.
5 votos
@David: Creo que estás perdiendo el punto... la media aritmética es una herramienta estadística, no es algo que se pueda "demostrar".
0 votos
A pesar de mi respuesta anterior, todavía estoy decepcionado de que nadie haya respondido al título de la pregunta ("¿Cómo funciona?") con la respuesta "Es como los imanes. Nadie entiende."
0 votos
Jaja, en otro foro me hicieron referencia a ese video. ¿Te refieres al video de Feynman verdad?
0 votos
De hecho, estaba pensando en la canción de Insane Clown Posse.
0 votos
@Dan: Y también no te olvides de Midian. Es donde viven los monstruos.
0 votos
Otros medios pueden ser útiles. En Física, donde muchas fórmulas son multiplicativas, la media geométrica puede ser más informativa.
0 votos
Hay una gran discusión al respecto en términos de optimización por John Myles White.
0 votos
Para demostrar que una fórmula para la media aritmética es correcta, primero tendríamos que tener una definición clara de 'media aritmética'. Luego podríamos comenzar a demostrar que el resultado de la fórmula es igual a lo descrito por la definición. Sin embargo, si la definición está escrita como una fórmula, y es la misma fórmula de la que estás preguntando, entonces no hay nada que hacer en una demostración.
0 votos
@fretty No estoy de acuerdo contigo. La estadística tiene fórmulas que han sido derivadas del pensamiento matemático y aquí estás haciendo un comentario degradante de que estas fórmulas no pueden ser probadas. Me pregunto cómo le encuentras sentido a las cosas que te rodean.