Parece que cuando se cumple el supuesto de homogeneidad de varianza que los resultados de un Welch ajustaron t-test y una prueba estándar de t son aproximadamente iguales. ¿Por qué no simplemente siempre uso la t Welch ajustado?
Respuestas
¿Demasiados anuncios?Me gustaría oponerse a los otros dos respuestas basadas en un papel (en alemán) por Kubinger, de Rasch y Moder (2009).
Ellos argumentan, basada en la "extensa" simulaciones de las distribuciones de reunión o no cumplir con los supuestos que se impuso por un t-test, (la normalidad y homogeinidad de la varianza) que el de welch-pruebas realiza igualmente bien cuando las hipótesis se cumplen (es decir, básicamente la misma probabilidad de cometer alfa y beta de los errores), pero supera la prueba de t si los supuestos no se cumplen, especialmente en términos de poder. Por lo tanto, se recomienda utilizar siempre el de welch-prueba si el tamaño de la muestra supera los 30.
Como un meta-comentario: Para la gente interesada en las estadísticas (como yo, y probablemente la mayoría de los otros aquí) un argumento basado en los datos (como la mía) al menos debe contar igualmente como argumentos basados solamente en el terreno teórico (como los otros).
Actualización:
Después de pensar acerca de este tema de nuevo, he encontrado dos nuevas recomendaciones de los cuales el más reciente ayuda a mi punto. Mira los papeles originales (que son tanto, al menos para mí, libremente disponible) para las argumentaciones que llevan a estas recomendaciones.
La primera recomendación viene de Graeme D. Ruxton, en 2006: "Si se quiere comparar la tendencia central de 2 poblaciones a partir de las muestras de la relación de los datos, entonces la desigualdad de la varianza de la prueba t debe ser siempre utilizado de preferencia para el test t de Student o U de Mann–Whitney."
En:
Ruxton, G. D., 2006. La desigualdad de la varianza de la prueba t es subutilizado
alternativa a la de la t de Student y la prueba de U de Mann–Whitney.
Behav. Ecol. 17, 688-690.
La segunda (la más antigua) es la recomendación de Coombs et al. (1996, pág. 148): "En resumen, las muestras independientes prueba t es generalmente aceptable en términos de controlar el error de Tipo I a las tarifas establecidas no son lo suficientemente grandes igualdad de muestras de tamaño, incluso cuando la igualdad de la varianza de la población supuesto es violado. La desigualdad de muestras de tamaño, sin embargo, una alternativa que no asume la igualdad de varianzas de la población es preferible. Utilice el James de segundo orden de la prueba cuando las distribuciones son de cola corta simétrica o normal. Alternativas prometedoras incluyen el Wilcox H y Yuen tapizados en medio de las pruebas, que proporcionan más amplio de control de Tipo I, las tasas de error de la prueba de Welch o el James de la prueba y tiene mayor poder cuando los datos son de cola larga." (énfasis añadido)
En:
Coombs WT, Algina J, Oltman D. 1996. Univariante y multivariante de omnibus pruebas de hipótesis seleccionada para el control de las tasas de error tipo I cuando la población de las varianzas no son necesariamente iguales. Rev Educ Res 66:137-79.
por supuesto, uno podría zanja de ambas pruebas, y comenzar a utilizar una Bayesiano t-test (Savage-Dickey ratio test), el cual puede dar cuenta de la desigual y varianzas desiguales, y lo mejor de todo, es que permite una cuantificación de la evidencia en favor de la hipótesis nula (lo que significa que, de no más de edad "no rechazar" hablar)
Esta prueba es muy simple y rápido de implementar, y hay un documento que explica claramente a los lectores no familiarizados con la estadística Bayesiana cómo se usa, junto con una R de secuencia de comandos. básicamente, sólo puede insertar sus datos de envío de los comandos a la R de la consola:
también hay un tutorial para todo esto, con datos de ejemplo:
http://www.ruudwetzels.com/index.php?src=SDtest
Sé que esto no es una respuesta directa a lo que se le pidió, pero yo pensaba que los lectores puedan disfrutar de esta buena alternativa
saludos
Porque resultados exactos son preferibles a aproximaciones y evitar los casos de borde extraño donde la aproximación puede conducir a un resultado diferente que el método exacto.
El método de Welch no es una manera más rápida que cualquier viejo t-test, es una aproximación manejable a un problema de otro modo muy difícil: Cómo construir una prueba t con varianzas desiguales. El caso de igualdad de varianza es bien entendido, simple y exacta y por lo tanto siempre se debe utilizar cuando sea posible.
Dos razones por las que puede pensar:
Regular de la T de Student es bastante robusto a la heterocedasticidad si los tamaños de muestra son iguales.
Si usted cree firmemente a priori de que los datos es homoscedástica, entonces usted no pierde nada y se puede ganar una pequeña cantidad de energía mediante el uso de Studen ts T en lugar de Welch T.
Una razón por la que me gustaría no dar es que la T de Student es exacta y Welch T no lo es. En mi humilde opinión la exactitud de la T de Student es académico porque es sólo una exacta para una distribución normal de los datos, y no hay datos reales es exactamente distribuidos normalmente. No puedo pensar en una sola cantidad que la gente realmente medir y analizar estadísticamente en donde la distribución plausiblemente podría tener un apoyo de todos los números reales. Por ejemplo, sólo hay tantos átomos en el universo, y algunas cantidades que no pueden ser negativos. Por lo tanto, cuando se utiliza cualquier tipo de T-test en datos reales, estás haciendo una aproximación de todos modos.