Parece ser una pregunta de la prueba de potencia. Si sólo mira un subconjunto que tiene mucho menos participantes y por lo tanto mucho menos energía para encontrar un efecto de tamaño similar.
Con un reducido tamaño de la muestra sólo se puede encontrar un efecto mucho más importante. Por lo que se recomienda NO mirar a los subconjuntos en este caso. A menos que exista una interacción (es decir, hacer los resultados apuntan en la misma dirección, tanto para hombres y mujeres?).
Además, no hay necesidad de utilizar un test de Wilcoxon, sólo porque sus datos no está distribuido normalmente (a menos que fuertemente se desvía). Probablemente, usted todavía puede utilizar la t.de prueba (por ejemplo, uno de los usuario de aquí, whuber, recomendado recientemente la t.prueba en un caso similar, ya que normalmente, la suposición no necesariamente para los datos, pero para la distribución de muestreo. citando a él: "La razón es que el muestreo de las distribuciones de los medios son aproximadamente normal, aunque las distribuciones de los datos no son").
Sin embargo, si usted todavía no se desea utilizar la t.la prueba de que hay más poderoso de la asunción libre' paramétrico de alternativas, especialmente las pruebas de permutación. Ver la respuesta a mi pregunta aquí (whubers cita es también de allí): Que permutación de prueba de implementación en R para usar en lugar de la prueba t (pareadas y no pareadas)?
En mi caso los resultados fueron incluso un poco mejor (es decir, menor p) que cuando se utiliza la t.prueba. Así que yo recomendaría esta prueba de permutación basado en el coin
paquete. Yo podría darle la r-comandos de los que proporcionar algunos datos de ejemplo en su pregunta.
Actualización: El efecto de los valores atípicos en la prueba de t
Si usted mira en la ayuda de t.prueba en R ?t.test
, usted encontrará el siguiente ejemplo:
t.test(1:10,y=c(7:20)) # P = .00001855
t.test(1:10,y=c(7:20, 200)) # P = .1245 -- NOT significant anymore
Aunque en el segundo caso, usted dispone de un extremer diferencia en el medio, el valor atípico conduce a la contra de la intuición hallazgo de que los datos ya no es significativa. Por lo tanto, un método para lidiar con los valores atípicos (por ejemplo, Winsorizing, aquíse recomienda para la realización de las pruebas paramétricas como el t si los datos lo permite.