Como parte de una pregunta de los deberes, me pidieron que calculara la media recortada de un conjunto de datos eliminando la observación más pequeña y la más grande, y que interpretara el resultado. La media recortada era menor que la media sin recortar.
Mi interpretación fue que esto se debía a que la distribución subyacente estaba sesgada positivamente, por lo que la cola izquierda es más densa que la cola derecha. Como resultado de esta asimetría, la eliminación de un dato alto arrastra la media hacia abajo más que la eliminación de uno bajo la empuja hacia arriba, porque, hablando informalmente, hay más datos bajos "esperando a ocupar su lugar". (¿Es esto razonable?)
Entonces empecé a preguntarme cómo afecta el porcentaje de recorte, así que calculé la media recortada $\bar x_{\operatorname{tr}(k)}$ para varios $k = 1/n, 2/n, \dotsc, (\frac{n}{2}-1)/n$ . Tengo una interesante forma parabólica:
No sé muy bien cómo interpretar esto. Intuitivamente, parece que la pendiente del gráfico debería ser (proporcional a) la asimetría negativa de la parte de la distribución dentro de $k$ puntos de datos de la mediana. (Esta hipótesis se confirma con mis datos, pero sólo tengo $n = 11$ Así que no estoy muy seguro).
¿Este tipo de gráfico tiene un nombre o es de uso común? ¿Qué información podemos obtener de este gráfico? ¿Existe una interpretación estándar?
Como referencia, los datos son: 4, 5, 5, 6, 11, 17, 18, 23, 33, 35, 80.