Parece que hay algo en nuestra comprensión humana que crea dificultades en la comprensión intuitiva de la idea de la varianza. En un sentido estricto, la respuesta es inmediata: el cuadrado nos lanza fuera de nuestra comprensión reflexiva. Pero, es la variación que presenta problemas, o es que la idea de la propagación en los datos? Buscamos refugio en el rango, o simplemente indicando el mínimo y el máximo, pero estamos de evitar la dificultad real? En la media (o mediana) nos encontramos con el centro, el resumen... una simplificación; la variación de los spreads de las cosas y los hace sentir incómodos. El hombre primitivo, sin duda haría uso de la media en la caza de animales por triangulación a la oración, pero supongo que fue mucho más tarde que nos vimos en la necesidad de cuantificar la propagación de las cosas. De hecho, el término de la varianza fue primero introducido por Ronald Fisher tan recientemente como en 1918 en el documento "la Correlación Entre Parientes en la Suposición de la Herencia Mendeliana."
La mayoría de las personas que siguen las noticias hayan escuchado la historia de Larry Summers " lamentable discurso acerca de las matemáticas aptitudes por medio de género, lo que posiblemente se relaciona con su salida de la universidad de Harvard. En pocas palabras, él sugirió una mayor varianza en la distribución de las matemáticas en la competencia entre los machos como en comparación con las mujeres, a pesar de que ambos géneros disfrutado de la misma media. Independientemente de la conveniencia o implicaciones políticas, esto parece ser motivada en la literatura científica.
Lo que es más importante, tal vez la comprensión de los problemas como el cambio climático - por favor, perdóname por traer a colación temas que podrían conducir a completamente fuera de lugar para el debate - por la población general podría ser ayudado por la mejora de la familiaridad con la idea de la varianza.
Se complica cuando tratamos de captar la covarianza, como se muestra en este post, con un gran y colorido respuesta por @whuber aquí.
Puede ser tentador para despedir a esta pregunta es demasiado general, pero está claro que estamos hablando de él de forma indirecta, como en este post, donde las matemáticas son triviales, pero el concepto sigue siendo difícil de alcanzar, lo que desmonta una forma más cómoda de aceptación de la gama como contraposición a la más matizada idea de la varianza.
En una carta de Fisher a la E. B. Ford, en referencia a la polémica sobre su sospecha en los experimentos Mendelianos, leemos: "Ahora, cuando los datos que había sido fingido, yo sé muy bien cómo, generalmente, las personas subestiman la frecuencia de la amplia posibilidad de desviaciones, por lo que la tendencia es siempre hacer que coinciden muy bien con las expectativas... de las desviaciones [en Mendel datos] son sorprendentemente pequeñas." El gran RA Fisher está tan interesado en la sospecha de pequeñas variaciones en pequeñas muestras que él escribe: "sigue siendo una posibilidad, entre otras, que Mendel fue engañado por algunos de los asistentes que sabía muy bien lo que se esperaba."
Y es muy posible que este sesgo hacia la comprensión o incomprensión de propagación persiste en la actualidad. Si es así, ¿hay alguna explicación de por qué nos sentimos más cómodos con la centralidad de los conceptos que con la dispersión? ¿Hay algo que podamos hacer para internalizar la idea?
Algunos de los conceptos que "vemos" en un instante, y luego que no, pero tenemos que aceptarlas y seguir adelante. Por ejemplo, $\small e^{i\pi}+1=0$ o $\small E=mc^2$, pero que en realidad no necesitan siquiera saben acerca de estas identidades para tomar decisiones en nuestra vida diaria. El mismo no es cierto de la varianza. Así pues, ¿no sería más intuitivo?
Nassim Taleb ha hecho una fortuna, aplicando su (bueno, realmente Benoit Mandelbrot s) percepción de la comprensión deficiente de la varianza para la explotación de los tiempos de crisis, y ha tratado de hacer el concepto comprensible para las masas con frases como, "la varianza de la varianza es, epistemológicamente, una medida de la falta de conocimiento acerca de la falta de conocimiento de la media" - sí, no hay más contexto a este bocado... Y para su crédito, él también ha hecho más fácil con el día de acción de gracias Turquía idea. Uno puede argumentar que la clave para invertir es la comprensión de la varianza y covarianza).
Así que ¿por qué es tan resbaladizo, y cómo remediarlo? Sin fórmulas... sólo la intuición de años de lidiar con la incertidumbre... no sé la respuesta, pero no es matemático (necesariamente): por ejemplo, me pregunto si la idea de curtosis interfiere con la varianza. En el siguiente gráco tenemos dos histogramas se superponen con prácticamente la misma varianza; sin embargo, mi reacción de reflejo es que el uno de los más colas, y el pico más alto (mayor curtosis) es más "spread":