10 votos

¿Cómo puede usted probar la homogeneidad de la varianza de dos grupos con diferentes tamaños de muestra?

Tengo dos grupos de datos que tienen diferentes tamaños de muestra y con el fin de ser capaz de analizar ambos conjuntos deben tener la misma varianza. Me dijeron que el uso de Bartlett para probar la homogeneidad de la varianza, pero cuando intento ejecutar la prueba en R se dice que los dos grupos deben tener el mismo tamaño de muestra.

  1. ¿De Bartlett prueba requiere que los grupos tienen el mismo tamaño de la muestra?

  2. ¿Cómo fue mi labmate capaz de analizar un conjunto de datos similares (dos grupos, diferentes tamaños de muestra) el uso de Bartlett?

  3. ¿Qué otras pruebas puedo usar que muestran los dos grupos similares de varianzas?

13voto

Sean Hanley Puntos 2428

No sé cuál es el código utilizado, pero las pruebas no requieren de la igualdad de tamaños de muestra. Usted puede utilizar el test de Levene prueba para comprobar la heterocedasticidad. En R, puede utilizar ?leveneTest en el coche de paquete:

set.seed(9719)                       # this makes the example exactly reproducible
g1 = rnorm( 50, mean=2, sd=2)        # here I generate data w/ different variances
g2 = rnorm(100, mean=3, sd=3)        #   & different sample sizes
my.data = stack(list(g1=g1, g2=g2))  # getting the data into 'stacked' format

library(car)                         # this package houses the function
leveneTest(values~ind, my.data)      # here I test for heteroscedasticity:
# Levene's Test for Homogeneity of Variance (center = median)
#        Df F value   Pr(>F)   
# group   1  8.4889 0.004128 **
#       148                    
# ---
# Signif. codes:  0 ‘***' 0.001 ‘**' 0.01 ‘*' 0.05 ‘.' 0.1 ‘ ' 1

Test de Levene de la prueba es de un $t$-prueba de ($F$-test) sobre los datos transformados. (Me discutir las pruebas de heterocedasticidad aquí: ¿por Qué la prueba de Levene de igualdad de varianzas en lugar de F relación?) Lo de tener el desigual tamaño de la muestra va a hacer es hacer que tenga menos poder para detectar una diferencia. Para comprender esto mejor, puede ayudar a leer mi respuesta a esta pregunta: ¿Cómo se debe interpretar la comparación de medias de los diferentes tamaños de muestra? Tenga en cuenta sin embargo, que la ejecución de una prueba de sus hipótesis y, a continuación, la elección de un principal de la prueba general, no se recomienda (ver, por ejemplo, aquí: Un método basado en principios para la elección de entre t-test o no-paramétrica, por ejemplo, de Wilcoxon para muestras pequeñas). Si usted está preocupado de que no puede ser heterocedasticidad, usted podría hacer mejor, simplemente, el uso de una prueba que no será susceptible a ella, tales como el de Welch $t$-prueba, o incluso el de la u de Mann-Whitney $U$-prueba (que no requiere normalidad). Algo de información acerca de las estrategias alternativas pueden ser recogidos a partir de mi respuesta aquí: Alternativas a la ANOVA de una vía para heteroskedastic de datos.

3voto

AdamSane Puntos 1825

Si usted está tratando de prueba de regresión/anova/t-test de hipótesis, el consejo de múltiples documentos es que es mejor no probar la hipótesis como una base para la elección de un procedimiento para aplicar (por ejemplo, para elegir entre una igualdad de varianza de la prueba t y de Welch-t-test o entre ANOVA y de Welch-Satterthwaite tipo ajustado ANOVA).

Si usted no puede hacer la suposición a priori y su original de los tamaños de las muestras no son iguales (o al menos muy cerca de la igualdad) se debe simplemente no utilizar un procedimiento en el que se asume la igualdad de varianzas (en efecto, siempre se asume que su prueba de heterocedasticidad iba a rechazar, sin mirar).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X