Esto NO es una respuesta completa, pero trato de esbozar mi idea.
Supongamos que tenemos un conjunto ordenado, digamos, en un orden creciente. Si queremos maximizar la diferencia entre la media y la mediana, es necesario (pero no suficiente) para mantener a los valores atípicos como sea posible (porque significa que está muy afectado por estos valores atípicos, mientras que la mediana no es). Los problemas aquí son: ¿cuántos es "muchos"? y cómo controlar la diferencia?
Supongamos $x_1 < x_2 < ... < x_n$. Podemos calcular su media y la mediana. Mi alogorithm (que todavía no he podido probar hasta ahora) es la siguiente:
- Si la media de $>$ meadian: eliminar la mediana o el número más próximo que es más GRANDE que la mediana, que es $x_{(n+1)/2}$ si $n $ es impar o $x_{n/2+1}$ si $n$ es incluso. El efecto de hacer esto es: después de cada paso, la media (no siempre) se hace más grande y más grande, pero la mediana (no siempre) se hace más pequeño y más pequeño (y por supuesto, siempre es más grande que la mediana en cada paso). Pero en general, la diferencia se hace más grande.
- Si la media de $<$ mediana: eliminar la mediana o el número más próximo que es MENOR que la mediana, que es $x_{(n+1)/2}$ si $n $ es impar o $x_{n/2-1}$ si $n$ es incluso. El efecto de hacer esto es: después de cada paso, la media (no siempre) se hace más pequeño y más pequeño, pero la mediana (no siempre) se hace más grande y más grande (y por supuesto, siempre es menor que la mediana en cada paso). Pero en general, la diferencia se hace más grande.
Resulta que, finalmente, sólo deberemos $3$ números de la izquierda (no puede ser $2$, de lo contrario la media de $=$ de la mediana): el más grande, el más pequeño, y el segundo más pequeño (si la media de $>$ de la mediana) o el segundo más grande (si la media de $<$ de la mediana). Estos $3$ números tendrán la diferencia máxima entre la media y la mediana.