Recientemente he pensado en una forma alternativa de "prueba de equivalencia" basada en una distancia entre los dos distribuciones y no entre sus medios.
Existen algunos métodos que proporcionan intervalos de confianza para la solapamiento de dos distribuciones gaussianas:
El solapamiento $O(P_1,P_2)$ de (¿entre?) dos distribuciones $P_1$ y $P_2$ tiene una buena interpretación probabilística: $$1-O(P_1,P_2)= TV(P_1,P_2)$$ donde $TV(P_1,P_2) = \sup_A \big|P_1(A) - P_2(A) \big|$ es el distancia de variación total entre $P_1$ y $P_2$ .
Esto significa que, por ejemplo, si $O(P_1,P_2)>0.9$ entonces las probabilidades dadas por $P_1$ y $P_2$ de cualquier evento no difieren más que $0.1$ . A grandes rasgos, las dos distribuciones hacen las mismas predicciones hasta $10\%$ .
Así, en lugar de utilizar un criterio de aceptación basado en un valor crítico para la diferencia entre las medias $\mu_1$ y $\mu_2$ como en las pruebas de equivalencia clásicas, podríamos basarnos en un valor crítico para la diferencia entre el probabilidades de las predicciones dadas por las dos distribuciones.
Creo que hay una ventaja en cuanto a la "objetividad" del criterio. El valor crítico de $|\mu_1 - \mu_2|$ debe ser dado por un experto del problema real: debe ser un valor a partir del cual la diferencia tenga una importancia práctica. Pero a veces nadie tiene un conocimiento sólido sobre el problema real y no hay ningún experto capaz de proporcionar un valor crítico. Adoptando un valor crítico convencional sobre $TV(P_1,P_2)$ podría ser un camino hacia un criterio no dependiente del problema físico considerado.
En el caso gaussiano con las mismas varianzas, el solapamiento está relacionado uno a uno con la diferencia de medias estandarizada $\frac{|\mu_1-\mu_2|}{\sigma}$ .