4 votos

¿Prueba t de varianzas desiguales o prueba U de Mann-Whitney?

Tengo dos muestras independientes y necesito comparar sus valores, para determinar si los valores en el primer grupo son mayores que los valores en el segundo grupo. Realicé la prueba de Levene y las varianzas son muy desiguales.

¿Es mejor usar la versión del t-test de SPSS (no se asumen varianzas iguales) o la prueba U de Mann-Whitney?

¿Tienes alguna referencia formal (un artículo que pueda citar) para la versión del t-test de SPSS cuando no se asumen varianzas iguales?

6voto

AdamSane Puntos 1825

El Mann-Whitney no requiere varianzas iguales a menos que estés buscando específicamente alternativas de cambio de ubicación.

En particular, es capaz de probar si la probabilidad de valores en el primer grupo es mayor que los valores en el segundo grupo, lo cual es una alternativa bastante general que parece estar relacionada con tu pregunta original.

No solo el Mann-Whitney puede manejar cambios de ubicación transformados muy bien (por ejemplo, un cambio de escala es un cambio de ubicación en los registros), tiene poder contra cualquier alternativa que haga que $P(X>Y)$ difiera de $\frac{1}{2}$.

La estadística U del Mann-Whitney cuenta la cantidad de veces que un valor en una muestra excede a un valor en la otra. Eso es una estimación escalada de la probabilidad de que un valor aleatorio de una población exceda a la otra.

cambio en P(X<Y) de 1/2

Hay más detalles aquí.

Además, consulta la discusión aquí.


En cuanto a cuál es mejor, bueno, eso realmente depende de varias cosas. Si los datos son incluso un poco más pesados en las colas que los normales, es posible que te funcione mejor el Mann-Whitney, pero eso depende de la situación - la discretización y el sesgo pueden complicar esa situación, y también depende de las precisas alternativas de interés.

3voto

Brandon Grossutti Puntos 140

Si los tamaños de muestra son desiguales, debemos usar la prueba t de varianzas no agrupadas. Si son iguales, use la agrupada. Aquí hay un extracto de "Understanding and Using Statistics in Psychology" (que coescribí con Phil Banyard).

"Hay varias formas diferentes de decidir si tus varianzas (o desviaciones estándar) son iguales. Una de las más comunes es la prueba de Levene. Si la prueba de Levene es estadísticamente significativa, esto significa que tus varianzas son diferentes entre sí y debes usar la prueba t de varianzas no agrupadas, que no asume homogeneidad de varianza. Si la prueba de Levene no es estadísticamente significativa, no tienes evidencia de que tus varianzas sean diferentes. En ese caso, es posible que puedas usar la prueba t de varianzas agrupadas (la prueba t normal).

Bien, ahora que eso está claro, te contamos la segunda razón por la que es un poco complicado. (¿Aún estabas esperando la segunda razón por la que era complicado?) El problema es que un resultado no significativo no significa que las varianzas sean iguales. Simplemente significa que no hemos encontrado que las varianzas sean diferentes. Y el problema con las pruebas, como la prueba de Levene, es que dependen del tamaño de la muestra, por lo que cuando el tamaño de la muestra es pequeño, la prueba de Levene no es muy buena para detectar diferencias en las varianzas. Cuando el tamaño de la muestra es grande, la prueba de Levene es muy buena para detectar diferencias en las varianzas.

¿Cuándo crees que es más importante que las varianzas sean iguales? Sí, eso es correcto, cuando el tamaño de la muestra es pequeño. Por lo tanto, cuando la prueba de Levene es buena para decirnos cuándo las varianzas son diferentes es precisamente cuando realmente no nos importa. Y cuando la prueba de Levene no es muy buena es precisamente cuando nos importa. Es un poco como tener una linterna solar: solo funciona cuando brilla el sol. (Ya casi terminamos, y si no entendiste bien la última parte, te va a gustar mucho la siguiente).

Resulta que la homogeneidad de varianza realmente no importa cuando los tamaños de muestra son aproximadamente iguales. Entonces, si tenemos tamaños de muestra iguales (o aproximadamente iguales), podemos ignorar la suposición de homogeneidad de varianza y usar la prueba t de varianzas agrupadas.

Cuando los tamaños de muestra son desiguales, la homogeneidad de varianza importa mucho más. Dado que solo tenemos pruebas de homogeneidad de varianza que pueden decirnos si la tenemos definitivamente o no, no debemos depender de ellas, y si los tamaños de muestra son desiguales, debemos usar la prueba t de varianzas no agrupadas. (Si realmente estás interesado en esto, hay un excelente artículo de Zimmerman (2004) que deberías leer)."

Aquí está la referencia de Zimmerman: http://onlinelibrary.wiley.com/doi/10.1348/000711004849222/full. Puede que esté detrás de un muro de pago, pero el resumen te dice todo lo que necesitas saber.

Aquí tienes la información del editor del libro del que se extrajo esto: http://www.sagepub.com/books/Book226292?siteId=sage-us&prodTypes=any&q=jeremy+miles&fs=1

Además, las varianzas iguales no asumidas no son la "versión de la prueba en SPSS", es la prueba t de Welch. La referencia es Welch, B. L. (1938). The significance of the difference between two means when the population variances are unequal. Biometrika 34: 29-35., que es bastante anterior a la producción de SPSS.

1voto

Grezzo Puntos 133

No has dicho exactamente qué estás midiendo. Si son datos de conteo, entonces este documento es muy útil. Me intriga la naturaleza de tus mediciones, ya que si tienes una media de 10 y una desviación estándar de 11, un número negativo para un valor una desviación estándar por debajo de la media puede o no ser significativo.

Revisión: análisis de parásitos y otros conteos sesgados Neal Alexander

DOI: 10.1111/j.1365-3156.2012.02987.x

Es gratuito en:

http://onlinelibrary.wiley.com/doi/10.1111/j.1365-3156.2012.02987.x/abstract;jsessionid=75360AF6882780119FBE6D905DFECFF7.f01t04

1voto

Auron Puntos 2123

Antes de usar cualquier prueba, vea si una transformación logarítmica hará que las varianzas sean más similares y, de ser así, aplique la prueba a los valores transformados. Cualquier conclusión que pueda sacar de datos log-transformados será igualmente aplicable a los datos originales sin transformar. Vea mi respuesta a esta pregunta y los comentarios generados para más ideas: Comparando el nivel de humo y hormonas en dos grupos de personas. ¿Qué prueba?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X