En Prueba de permutación también podría aplicarse en este caso. La idea es la siguiente.
Sea X1,...,Xm∼FX1,...,Xm∼F y Y1,...,Yn∼GY1,...,Yn∼G sean dos muestras independientes y consideremos la comprobación de la hipótesis H0:F=GH0:F=G vs. H1:F≠GH1:F≠G . Para ello, etiquete sus datos del siguiente modo
1X11X2⋮⋮1Xm2Y12Y2⋮⋮2Yn
Ahora, dejemos que T sea un estadístico de la muestra S={X1,...,Xm,Y1,...,Yn} y las etiquetas L={1,1,...,2,2,...,2} .
Si H0 es verdadera, entonces el etiquetado es superfluo.
Ahora, permute las etiquetas de los grupos y vuelva a calcular la estadística de la prueba un gran número de veces, por ejemplo B .
El valor p unilateral de esta prueba se calcula como la proporción de permutaciones muestreadas en las que la diferencia de medias fue mayor o igual que T(S,L) . El valor p bilateral de la prueba se calcula como la proporción de permutaciones muestreadas en las que la diferencia absoluta fue mayor o igual que abs(T(S,L)) . Véase
Un ejemplo de juguete
Sea Xi∼Poisson(10) , i=1,...,m=100 y Yj∼Poisson(11) , j=1,...,n=100 . Considere la estadística T=mean of Group 1−mean of Group 2 . A continuación se aplica el método de permutación que utiliza este estadístico.
rm(list=ls)
set.seed(1)
ns=100
x = rpois(ns,11)
y = rpois(ns,10)
T.obs = mean(x) - mean(y)
SL = rbind(cbind(rep(1,ns),x),cbind(rep(2,ns),y))
B=10000
T = rep(0,B)
for(i in 1:B){
samp = sample(SL[,1])
ind1 = which(samp==1)
ind2 = which(samp==2)
T[i] = mean( SL[ind1,2] )- mean( SL[ind2,2] )
}
p.value = length(which(abs(T)>abs(T.obs)))/B
No sé hasta qué punto es robusto este método, pero después de algunos experimentos parece funcionar moderadamente bien. Obsérvese que la elección del T es abierta y, por lo tanto, hay que tener cuidado al hacer una elección significativa en el contexto de su problema, ya que el rendimiento depende tanto de la estadística como del tamaño de la muestra.
Espero que esto ayude.