Dices que tienes un gran número de puntos de datos por celda. En ese las medianas de las celdas deberían tener una distribución normal. (Véase la simulación más abajo). Así que podría realizar una prueba t de dos muestras en las medianas de las celdas para ver si los grupos de Control y Tratamiento difieren. No he visto sus datos, pero probablemente estaría bien utilizar las medias de las celdas porque tiene muchos puntos de datos por celda.
En principio, nada impide realizar un análisis no paramétrico de Mann-Whitney-Wilcoxon. como sugiere @Parnian, pero con sólo cinco celdas cada uno en los grupos de Tratamiento y Control, puede ser un ejercicio inútil. Está cerca del límite inferior absoluto del tamaño de las muestras para los que la prueba MWW es útil.
Por ejemplo, para la prueba MWW basada en rangos, si sólo tuviera cuatro celdas en cada grupo, todas las celdas de tratamiento tendrían que tener "promedios" mayores que cualquiera de las celdas de Control (o viceversa) para obtener un resultado significativo. significativo. Sólo hay ${8 \choose 4} = 70$ posibles disposiciones de los rangos las dos más extremas corresponden a una separación completa de los valores de los dos grupos; $2/70 = 0.029$ por lo que es posible obtener un valor P significativo. Pero en cuanto se produce un solapamiento en en absoluto, el menor valor P posible pasa a ser mayor que $0.05.$
Además, aquí hay un ejemplo de prueba MWW con cinco Valores de tratamiento y cinco de control que no es significativo al nivel del 5%. En cambio, una prueba t encuentra una diferencia significativa a ese nivel.
wilcox.test(c(10, 20, 30, 40), c(38, 48, 58, 68))$p.val
[1] 0.05714286
t.test(c(10, 20, 30, 40), c(38, 48, 58, 68))$p.val
[1] 0.02201958
Simulación: CLT para media y mediana. Por último, supongamos que tenemos muestras de tamaño 500 de la distribución asimétrica $\mathsf{Gamma}(2, 1).$ Por el Teorema Central del Límite, las medias de tales muestras serán casi normales. Pero también existe un CLT para las medianas. He aquí una simulación con medias a
y medianas h
de $100\,000$ muestras de tamaño $n=500$ de este distribución. Las medianas son un poco más variables, pero normales al fin y al cabo.
set.seed(604); m = 10^5; n = 500
x = rgamma(m*n, 2, 1)
DTA = matrix(x, nrow=m) # each row of matrix is sample
a = rowMeans(DTA); h = apply(DTA,1,median)
par(mfrow=c(1,3))
curve(dgamma(x,2,1), 0,10, col="blue", lwd=2, ylab="PDF",
main="Density of GAMMA(2,1)")
abline(v=0,col="green2"); abline(h=0,col="green2")
hist(a, prob=T, br=30, col="skyblue2",
main="n=500: Sample Means")
hist(h, prob=T, br=30, col="skyblue2",
main="n=500: Sample Medians")
par(mfrow=c(1,1))