6 votos

Rendimiento de Wilcoxon-Mann-Whitney prueba con tamaños de muestra grandes (> 100.000) de los almacenes de datos médicos

Dos grandes conjuntos de datos de pacientes (grupo a: n = 100.000; serie B: n = 700,000) se comparan con respecto a su longitud de hospital-de-la estancia (LOS). La variable de LOS que se reporta como un entero en el almacén de datos, normalmente entre 2 y 7, por lo que decenas de miles de pacientes en cada grupo tendrá el mismo valor para LOS. ¿El grupo tiene una diferente de LOS del grupo B? Las desviaciones de los de los dos grupos son muy diferentes el uno del otro; ambos tienen una distribución sesgada.

En la literatura médica que uno ve típicamente una de Wilcoxon-Mann-Whitney prueba que se utilizan en la comparación de los de los dos grupos y los informes como una prueba de la diferencia entre las medianas. Por lo general, debido a la desigualdad de la varianza y el tamaño de la muestra, tal enfoque no se ajusta a lo que llamaron "cambio de modelo".

Quiero evitar el uso de este popular sino defectuoso planteamiento, pero tengo dos preguntas:

  1. Si estoy usando la W-M-W prueba como se pretendía originalmente (prueba de la hipótesis nula Prob(x < Y) = 0.5), la desigualdad de las muestras de tamaños (de 100.000 frente a los 700.000) o las varianzas desiguales invalidar el resultado de la prueba?

  2. Hay un buen test para la comparación de la mediana de LOS de los dos grupos? Resulta que el grupo a tiene una mediana de LOS de 4 días, mientras que el grupo B tiene una mediana de LOS de 5 días, por lo que a priori, dado el gran tamaño de la muestra, uno podría esperar que los dos grupos difieren significativamente en sus mediana de LOS.

6voto

AdamSane Puntos 1825

Sus tamaños de muestra son tan grandes que sería sorprendente no encontrar diferencias en casi cualquier medida razonable de la diferencia entre las distribuciones de población.

En la literatura médica que uno ve típicamente una de Wilcoxon-Mann-Whitney prueba que se utilizan en la comparación de los de los dos grupos y los informes como una prueba de la diferencia entre las medianas.

Ya se parecen a entender claramente que no es realmente la prueba de que sin supuestos adicionales.

Por lo general, debido a la desigualdad de la varianza y el tamaño de la muestra, tal enfoque no se ajusta a lo que llamaron "cambio de modelo".

Usted no necesita un puro cambio de alternativa para que sea una prueba de la igualdad de las medianas; sin embargo, que la hace considerablemente más fácil de interpretar un rechazo.

Si estoy usando la W-M-W prueba como se pretendía originalmente (prueba de la hipótesis nula Prob(x < Y) = 0.5), la desigualdad de las muestras de tamaños (de 100.000 frente a los 700.000) o las varianzas desiguales invalidar el resultado de la prueba?

Desigual tamaño de la muestra no será un problema. Varianzas desiguales no es en modo alguno un problema para la de Wilcoxon-Mann-Whitney-a pesar de que puede ser un problema si usted desea utilizar para probar la igualdad de las medianas (en particular, si desea insistir en que sus alternativas sólo puede ser la ubicación de los turnos). La distinción es tanto un problema para los que como la varianza.

Puede haber desafíos para este tipo de enfoque, pero que en realidad no vienen de esas direcciones.

Hay un buen test para la comparación de la mediana de LOS de los dos grupos?

¿Usted ha considerado una prueba de permutación con la prueba estadística de la diferencia en las medianas de la muestra? No será posible calcular la permutación exacta de la distribución, pero podría ser muestreados para cualquier precisión deseada.

Hay también el estado de Ánimo de la mediana de la prueba. Es tal vez un poco de baja potencia pero que probablemente no es mucho de un problema con ese tipo de tamaño de la muestra.

No veo realmente una gran necesidad de una prueba aquí, sin embargo (rechazar); lo que es probable que ser un poco más interesante sería dar un intervalo para la diferencia en las medianas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X