Sin duda te han dicho lo contrario, pero significa $=$ La mediana sí no implican simetría.
Existe una medida de asimetría basada en la media menos la mediana (la segunda asimetría de Pearson), pero puede ser 0 cuando la distribución no es simétrica (como cualquiera de las medidas de asimetría comunes).
Del mismo modo, la relación entre la media y la mediana no implica necesariamente una relación similar entre la mediana ( $(Q_1+Q_3)/2$ ) y la mediana. Pueden sugerir asimetrías opuestas, o una puede ser igual a la mediana mientras que la otra no.
Una forma de investigar la simetría es a través de un gráfico de simetría *.
Si $Y_{(1)}, Y_{(2)}, ..., Y_{(n)}$ son las observaciones ordenadas de menor a mayor (las estadísticas de orden), y $M$ es la mediana, entonces un gráfico de simetría traza $Y_{(n)}-M$ vs $M-Y_{(1)}$ , $Y_{(n-1)}-M$ vs $M-Y_{(2)}$ ... y así sucesivamente.
* Minitab puede hacerlo . De hecho, planteo este gráfico como una posibilidad porque los he visto hacer en Minitab.
He aquí cuatro ejemplos:
$\hspace{6cm} \textbf{Symmetry plots}$
(Las distribuciones reales fueron (de izquierda a derecha, primero la fila superior) - Laplace, Gamma(forma=0,8), beta(2,2) y beta(5,2). El código es de Ross Ihaka, de aquí )
En los ejemplos simétricos de cola pesada, suele ocurrir que los puntos más extremos pueden estar muy alejados de la recta; se prestaría menos atención a la distancia a la recta de uno o dos puntos a medida que se acerca a la parte superior derecha de la figura.
Hay, por supuesto, otros gráficos (mencioné el gráfico de simetría no por un sentido particular de defensa de ese, sino porque sabía que ya estaba implementado en Minitab). Así que vamos a explorar algunos otros.
Aquí están los correspondientes gráficos asimétricos que Nick Cox sugirió en los comentarios:
$\hspace{6cm} \textbf{Skewness plots}$
En estos gráficos, una tendencia al alza indicaría una cola derecha típicamente más pesada que la izquierda y una tendencia a la baja indicaría una cola izquierda típicamente más pesada que la derecha, mientras que la simetría sería sugerida por un gráfico relativamente plano (aunque quizás bastante ruidoso).
Nick sugiere que esta trama es mejor (concretamente "más directa"). Me inclino a estar de acuerdo; la interpretación del gráfico parece, en consecuencia, un poco más fácil, aunque la información de los gráficos correspondientes suele ser bastante similar (después de restar la pendiente unitaria en el primer conjunto, se obtiene algo muy parecido al segundo conjunto).
Por supuesto, ninguna de estas cosas nos dirá que la distribución de la que se han extraído los datos es realmente simétrica; obtenemos una indicación de lo cercana a la simetría que es la muestra y, por tanto, hasta ese punto podemos juzgar si los datos son razonablemente consistentes con la extracción de una población casi simétrica].
0 votos
Comentario ortogonal sobre un detalle: ¿qué unidades son m/gall? Parecen metros por galón, y me intriga.
0 votos
El hecho de que los gráficos de caja no suelan mostrar las medias es una grave limitación.
0 votos
¿Cuál es la desviación estándar de sus datos? Si el valor de 0,487m/gall es mucho menor que su desviación estándar, entonces probablemente tiene razones para creer que su distribución puede ser simétrica. Si ese valor es mucho mayor que su desviación estándar (o MAD o cualquier otra medida de desviación que considere), probablemente examinar la simetría de la distribución sea una pérdida de tiempo.
1 votos
$-70,-63,-56,-49,-42,-35,-28,-21,-14,-7,0,1,4,9,16,25,36,49,64,81,100$ no es deliberadamente simétrica (uniforme en la mitad inferior pero no en la superior) y un gráfico de caja situaría la mediana (igual a la media) más cerca del cuartil superior que del cuartil inferior, pero también más cerca del mínimo que del máximo.
0 votos
@NickCox también podría ser milagrosa con una errata. Serían casi 500 $\mu$ ¡galón! O menos que $10^{-4}$ g's. (Por supuesto, como se ha señalado anteriormente, sin alguna escala de dispersión como la MAD, no hay forma de saber qué puede ser "significativo").
0 votos
@GeoMatt2 Podría ser; si tuviera que apostar lo haría por m que significa millas y por tanto millas por galón.