Eliminaré todos los detalles biológicos y experimentos y citaré sólo el problema en cuestión y lo que he hecho estadísticamente. Me gustaría saber si es correcto, y si no, cómo proceder. Si los datos (o mi explicación) no son lo suficientemente claros, intentaré explicarme mejor editándolos.
Supongamos que tengo dos grupos/observaciones, X e Y, con tamaño $N_x=215$ y $N_y=40$ . Me gustaría saber si las medias de estas dos observaciones son iguales. Mi primera pregunta es:
-
Si se cumplen los supuestos, ¿es pertinente utilizar aquí una prueba t paramétrica de dos muestras? Lo pregunto porque, según tengo entendido, suele aplicarse cuando el tamaño es pequeño.
-
He trazado histogramas de X e Y y no se distribuyen normalmente, uno de los supuestos de una prueba t de dos muestras. Mi confusión es que, considero que son dos poblaciones y por eso comprobé la distribución normal. Pero entonces estoy a punto de realizar una prueba t de dos MUESTRAS... ¿Es correcto?
-
Según el teorema central del límite, si realizas un muestreo (con o sin repetición, en función del tamaño de la población) varias veces y calculas la media de las muestras cada vez, la distribución será aproximadamente normal. Y, la media de esta variable aleatoria será una buena estimación de la media de la población. Así que decidí hacer esto tanto en X como en Y, 1000 veces, y obtuve muestras, y asigné una variable aleatoria a la media de cada muestra. El gráfico tenía una distribución muy normal. Las medias de X e Y eran 4,2 y 15,8 (que coincidían con la población +- 0,15) y las varianzas eran 0,95 y 12,11.
He realizado una prueba t sobre estas dos observaciones (1000 puntos de datos cada una) con varianzas desiguales, porque son muy diferentes (0,95 y 12,11). Y se rechazó la hipótesis nula.
¿Tiene esto algún sentido? ¿Es este enfoque correcto / significativo o basta con una prueba z de dos muestras o es totalmente erróneo? -
También realicé una prueba no paramétrica de Wilcoxon para asegurarme (con X e Y originales) y la hipótesis nula también se rechazó de forma convincente. En el caso de que mi método anterior fuera totalmente erróneo, supongo que hacer una prueba no paramétrica es bueno, ¿excepto por la potencia estadística quizás?
En ambos casos, las medias fueron significativamente diferentes. Sin embargo, me gustaría saber si alguno de los enfoques, o ambos, son defectuosos/totalmente erróneos y, en caso afirmativo, ¿cuál es la alternativa?