Tengo un conjunto de datos de 21 puntos. A continuación se muestra un diagrama de caja de esos datos.
Intento interpretar este diagrama de caja. ¿Es seguro decir que el 96% de mis puntos de datos están por debajo de 48? Obtuve el 96% dividiendo 100 por 21 (longitud de mi conjunto de datos). Supongo que no es correcto decir que el 100% de los datos están por debajo de 48 debido al valor atípico.
ACTUALIZACIÓN
No estoy buscando una explicación de lo que son los gráficos de caja. Entiendo lo que ayudan a identificar e interpretar. Entiendo los IQR, percentiles, rango, etc. He añadido detalles adicionales al título de mi pregunta para mayor claridad.