Sí, puedes. Al menos en un sentido aproximado.
Detallo a continuación (y de hecho hay una relación con la "superposición de cajas" como sugieres) junto con algunas advertencias y limitaciones. Pero primero discutamos algunos conceptos preliminares para tener algo de antecedentes y contexto. (Creo que una respuesta apropiada aquí debería centrarse no en los detalles del ejemplo - aunque tal vez eso merezca alguna mención aparte - sino en el tema central de usar diagramas de caja para evaluar si las diferencias aparentes pueden explicarse fácilmente como variación aleatoria o no.)
Si tienes acceso a los datos, puedes dibujar diagramas de caja con muescas que están diseñados para este tipo de comparación visual.
Hay una discusión sobre el cálculo de diagramas de caja con muescas aquí. Si los intervalos de las muescas (para los valores predeterminados típicos) no se superponen, los dos grupos que se comparan son diferentes al nivel del 5% (aproximadamente); los cálculos se basan en cálculos en la distribución normal, pero son bastante robustos y funcionan bastante bien en una variedad de distribuciones. Si se trata como una prueba formal, el poder no es muy alto en la normal, pero debería funcionar bastante bien para una variedad de casos más o menos "típicos" con colas más pesadas.
Teniendo en cuenta cómo funcionan los diagramas de caja con muescas, puedes discernir una regla de oro rápida que funcionará cuando solo tengas una visualización como la que se muestra en la pregunta. Cuando el tamaño de la muestra es 10 y la mediana está cerca del centro de la caja, las muescas en un diagrama de caja con muescas tienen aproximadamente el ancho de la caja, por lo que los extremos de las muescas y la caja están aproximadamente en el mismo lugar.
Consulta aquí para discusión de cómo surge una regla de oro "$n=10$".
Sin embargo, no necesitas que la mediana esté en el centro de la caja para esta comparación; eso solo explica cómo llegamos a la regla. Aunque comenzamos desde diagramas de caja con muescas y un cálculo basado en la normal de un intervalo para la mediana, ahora estamos considerando simplemente la regla de "superposición de cajas" en $n=10$ y una hipótesis nula que (junto con cualquier otra suposición) resultaría en distribuciones continuas idénticas frente a alguna alternativa que tendería a separar las cajas (no necesariamente un cambio de ubicación puro, aunque esa es la alternativa más fácil de interpretar).
Las probabilidades de los posibles órdenes relativos de los cuartiles (bisagras en un diagrama de caja que se adhiere a la definición de Tukey) en tamaños de muestra donde ocurren en observaciones individuales no dependen de la forma de la distribución bajo la hipótesis nula. En ese caso (por ejemplo, en $n=9$ en cada muestra) esta versión de la prueba es libre de distribución. En $n=10$ no es libre de distribución (ya que la distribución de los promedios de estadísticas de orden adyacentes ahora se relaciona con la forma de la distribución) pero es casi libre de distribución.
Tasas de error de tipo I cerca de $n=10$: La simulación a través de varios de las distribuciones comúnmente utilizadas (tanto simétricas como sesgadas, con colas pesadas y ligeras) muestra que la prueba de superposición de cajas de dos muestras tiene un nivel de significancia del 2.3% en $n=10,10$ (realmente no hay mucha variación entre distribuciones) y es aproximadamente una prueba del 5.6% en $n=9,9$ (vuelve por debajo del 5% en $n=8,8$, presumiblemente debido al promedio de las estadísticas de orden reduciendo más la varianza que la pérdida de una observación aumenta). Si tienes muestras de 9 y 10, el nivel de significancia es inferior al 5%.
Otros tamaños de muestra: Si conoces los tamaños de muestra, puedes averiguar dónde van las muescas solo con la visualización. Si tienes un límite inferior en los tamaños de muestra, puedes obtener un límite superior en los lugares de las muescas. Pero incluso si todo lo que sabes es que $n$ es al menos 10, puedes verificar rápidamente la superposición de cajas. El ancho de los intervalos de las muescas es proporcional a $\sqrt{n}$, por lo que puedes calcular que en $n=40$, las muescas deberían estar aproximadamente a mitad de camino entre cada cuartil y la mediana.
Observando tu gráfico:
Observa que podemos deducir por la apariencia del gráfico en la pregunta que los tamaños de muestra deben ser al menos 5; si fueran menos de 5, los diagramas de caja de cada muestra individual tendrían pistas distintas de que provienen de un tamaño de muestra menor (como medianas justo en el centro de cada caja, o la longitud de los bigotes siendo 0 cuando hay un valor atípico).
Alternativamente, si las cajas (marcando los cuartiles) no se superponen entre sí y el tamaño de muestra es al menos 10, entonces los dos grupos que se comparan deberían tener medianas diferentes al nivel del 5% (considerado como una comparación pareja).
Si no conoces los valores de $n$, ya que sabemos que los tamaños de muestra deberían ser al menos 5, solo necesitas hacer los intervalos un poco más grandes que las cajas, específicamente, si extiendes cada caja aproximadamente el 40% de la distancia desde la mediana y aún no se superponen, indicarían una diferencia significativa para $n=5$ - regresando aquí a un argumento basado en el razonamiento de los diagramas de caja con muescas en lugar de la base más amplia que podemos discernir solo comparando las cajas.
[Nota, que esto no tiene en cuenta el número de comparaciones, por lo que si estás haciendo múltiples comparaciones, tu error de tipo I total será mayor. Está destinado a una inspección visual en lugar de una prueba formal; sin embargo, las ideas involucradas se pueden adaptar a un enfoque más formal, incluido el ajuste para múltiples comparaciones.]
Habiendo abordado si puedes, sería razonable considerar si deberías. Quizás no; el problema de posibles p-hacking es real, pero si estás usando esto para averiguar si, por ejemplo, perseguir la recolección de nuevos datos sobre el tema de investigación y todo lo que tienes es un diagrama de caja en un artículo - digamos - podría ser bastante útil poder hacer alguna evaluación de si hay más allá de lo que podría explicarse fácilmente por la variación debida al ruido. Pero considerar ese tema en profundidad realmente estaría respondiendo a una pregunta diferente.
0 votos
Los círculos representan valores atípicos.
3 votos
Siempre y cuando el gráfico no incluya ninguna indicación del tamaño de la muestra, eso es difícil. Pero si incluyes con el gráfico intervalos de confianza para las medianas, podrías comparar esos intervalos de confianza. No parecen estar presentes en tu gráfico.
0 votos
@kjetilbhalvorsen esto es solo un gráfico que he tomado de Google :) ... He incluido, en mi propio gráfico, exactamente lo que has descrito, como parte de una prueba de Tukey's HSD
2 votos
Sin intervalos de confianza, no se pueden hablar de diferencias "significativas". Sin embargo, yo diría que hay una diferencia "notable" entre jueves y viernes. O incluso "la diferencia más notable" ocurre entre jueves y viernes.
1 votos
Los círculos son puntos que están a más de 1.5 RIC del cuartíl más cercano. No son valores atípicos de forma inequívoca y objetiva. Lo que sucede el jueves no parece extraordinario en comparación con el resto de la distribución. En cambio, lo que sucede el viernes sí lo es; y un investigador o analista debería querer investigarlo si es posible y ver si hay una historia que lo explique. ¡Quizás alguien realmente no durmió! Marcar los puntos de datos de esta manera es marcarlos para su inspección y consideración. No es un método estadístico para identificar demonios que deben ser exorcizados.
0 votos
IQR = rango intercuartílico (no rango interno de cuartil). Ese último término resulta estar lleno de significado; simplemente no es el término estándar.