Contexto: Prueba de hipótesis utilizando pruebas de permutación sobre 2 poblaciones, asumiendo que tomo k1 y k2 elementos de la población 1 y 2, respectivamente, donde k1,k2∈Z≥1:
Ho: m1=m2; Ha:m1≠m2 donde mx se refiere a la mediana de la población x.
Preocupación: En las pruebas de permutación, calcularíamos la estadística de prueba de interés (¯m1−¯m2) para cada permutación posible (es decir, (k1+k2)!) y usaríamos el histograma de estos valores como la distribución nula (es decir, distribución de muestreo de la estadística de prueba mencionada bajo la hipótesis nula), utilizándolo para obtener un valor p. Esto parece implicar que al asumir la hipótesis nula anterior, cada permutación de nuestra muestra es igualmente probable, y es esto con lo que no estoy de acuerdo. Me parece que para llegar a esta conclusión, la hipótesis nula tendría que ser mucho más general (es decir, que las dos poblaciones tienen distribuciones idénticas e independientes, como se menciona en http://sphweb.bumc.bu.edu/otlt/mph-modules/bs/bs704_nonparametric/bs704_nonparametric2.html), pero eso también significaría que rechazar la hipótesis nula sería rechazar una hipótesis mucho más amplia y no nuestra hipótesis deseada de que las medianas son iguales (es decir, que las dos poblaciones no tienen distribuciones idénticas e independientes, lo que puede o no significar que tengan la misma mediana).
Resumen de la Preocupación: ¿Qué justifica el uso de la distribución de la estadística de prueba al permutar nuestras muestras para representar la distribución nula anterior?
Estoy asumiendo que hay cierta justificación porque creo que realizamos pruebas de esta manera en mi curso de estadísticas, pero nunca me detuve a reflexionar sobre los pasos del procedimiento para asegurarme de que los entendía completamente.
También una pregunta adicional: ¿Cuando la estadística de prueba observada es 0, se rechaza la hipótesis nula o se falla al rechazar la hipótesis nula? (He leído que siempre se debe asumir que los datos son consistentes con la hipótesis nula por defecto, a menos que tus datos tengan un valor de estadística de prueba observado que se alinee con la hipótesis alternativa y que sea estadísticamente significativo.)