6 votos

Subconjuntos no significativamente diferentes, pero es superconjunto

Tengo varios datos clínicos de los participantes en un estudio. Estoy buscando a una variable continua ("A") y una (binario) de la variable categórica (grupo) ("O"). He utilizado un test de Wilcoxon en R (los datos no están distribuidos normalmente) para ver si "a" es significativamente diferente entre los dos grupos. Tengo una frontera p-valor de 0.054.

Si ejecuto la de Wilcoxon de nuevo, pero incluyen solamente los varones (30 de 72), el p-valor es de ~0.3; para las mujeres sólo es ~0.25.

¿Cómo es posible que no hay ninguna diferencia en la "A" entre los grupos de machos y hembras por separado, pero cuando se combina hay una diferencia?

8voto

Anthony Cramp Puntos 126

Parece ser una pregunta de la prueba de potencia. Si sólo mira un subconjunto que tiene mucho menos participantes y por lo tanto mucho menos energía para encontrar un efecto de tamaño similar.

Con un reducido tamaño de la muestra sólo se puede encontrar un efecto mucho más importante. Por lo que se recomienda NO mirar a los subconjuntos en este caso. A menos que exista una interacción (es decir, hacer los resultados apuntan en la misma dirección, tanto para hombres y mujeres?).

Además, no hay necesidad de utilizar un test de Wilcoxon, sólo porque sus datos no está distribuido normalmente (a menos que fuertemente se desvía). Probablemente, usted todavía puede utilizar la t.de prueba (por ejemplo, uno de los usuario de aquí, whuber, recomendado recientemente la t.prueba en un caso similar, ya que normalmente, la suposición no necesariamente para los datos, pero para la distribución de muestreo. citando a él: "La razón es que el muestreo de las distribuciones de los medios son aproximadamente normal, aunque las distribuciones de los datos no son").

Sin embargo, si usted todavía no se desea utilizar la t.la prueba de que hay más poderoso de la asunción libre' paramétrico de alternativas, especialmente las pruebas de permutación. Ver la respuesta a mi pregunta aquí (whubers cita es también de allí): Que permutación de prueba de implementación en R para usar en lugar de la prueba t (pareadas y no pareadas)?
En mi caso los resultados fueron incluso un poco mejor (es decir, menor p) que cuando se utiliza la t.prueba. Así que yo recomendaría esta prueba de permutación basado en el coin paquete. Yo podría darle la r-comandos de los que proporcionar algunos datos de ejemplo en su pregunta.

Actualización: El efecto de los valores atípicos en la prueba de t
Si usted mira en la ayuda de t.prueba en R ?t.test, usted encontrará el siguiente ejemplo:

t.test(1:10,y=c(7:20))      # P = .00001855
t.test(1:10,y=c(7:20, 200)) # P = .1245    -- NOT significant anymore

Aunque en el segundo caso, usted dispone de un extremer diferencia en el medio, el valor atípico conduce a la contra de la intuición hallazgo de que los datos ya no es significativa. Por lo tanto, un método para lidiar con los valores atípicos (por ejemplo, Winsorizing, aquíse recomienda para la realización de las pruebas paramétricas como el t si los datos lo permite.

7voto

Berek Bryan Puntos 349

Esto no es necesariamente una cuestión de poder estadístico; también podría ser un ejemplo de confusión.

Ejemplo:

  • Una categoría de $O$ es más común en los hombres, pero la otra es más común en las mujeres
  • La distribución de $A$ diferencia entre machos y hembras
  • Dentro de cada sexo por separado, la distribución de $A$ es exactamente el mismo para ambos $O$ categorías

A continuación, habrá una total diferencia en la distribución de $A$ entre el $O$ categorías.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X