Ubicación diferencias
U de Mann-Whitney no de la prueba de diferencias de medias
Voy a empezar derribando el más simple de las preguntas. Si su pregunta fundamental acerca de la ubicación de las diferencias es una diferencia en el medio, entonces usted probablemente no querrá que una prueba no paramétrica como la u de Mann-Whitney. El test de Mann-Whitney test, es una prueba de dominancia estocástica. Así que, dado que dos de los grupos a y B, si yo fuera a dibujar aleatoriamente a partir de a y B, cuyo valor sería mayor. Si se cancelan en promedio, entonces no hay dominancia estocástica; el opuesto de la siguiente manera. Esta prueba el trabajo, independientemente de la no-normalidad o heterocedasticidad. Sin embargo, si usted tiene la no-normalidad y heterocedasticidad en particular, entonces esta prueba es nada, pero una prueba de la media de diferencia. La media de diferencia puede ser cero, pero usted puede fácilmente tener dominancia estocástica de un grupo sobre el otro. Dada la opción, yo personalmente podría estar más interesado en una prueba de dominancia estocástica, pero no son comúnmente explicado así en la parte más aplicada de la literatura que vienen a través.
No normalidad no puede ser demasiado importante
Siguiente tema es de normalidad en relación a la media de las diferencias. Vamos a traer la normalidad de nuevo en relación a la varianza de las diferencias como las cosas funcionan un poco diferente. A menos que se espera que los datos a ser extremadamente no-normal, el tamaño de la muestra que usted tiene puede ser lo suficientemente grande como para ignorar las preguntas de la normalidad. Si los datos son extremadamente no-normal o se puede plantear la hipótesis de una distribución teórica a partir de la cual pueden surgir, entonces tal vez es mejor ejecutar el modelo con el que la distribución de Poisson para datos de conteo o de ingresos. También, ciertas transformaciones podría tener sentido en teoría, de tal manera que usted puede esperar para usarlos incluso antes de la visualización de los datos. El punto que estoy tratando de hacer es con relación a la media de las diferencias, la heterocedasticidad puede ser más consecuente en su situación.
Si usted tiene que examinar la normalidad, saber que todas las demás cosas constantes, pruebas estadísticas mejorar en su capacidad para detectar diferencias dado el mayor tamaño de la muestra. Shapiro-Wilk podría ser capaz de detectar menores desviaciones de la normalidad en el tamaño de la muestra que usted tiene. Además, si haces la prueba, usted probablemente debería hacerlo en los datos después de restar fuera del grupo de medios. Lo más importante es que a pesar de que, en futuras tomas de decisiones depende de que tales pruebas preliminares que pueden hacer que su eventual decisión errónea. No sé de estudios de la clase con normalidad las pruebas, pero hay estudios con heterocedasticidad-pruebas de véase, por uno:
- Zimmerman, D. W. (2004). Una nota sobre las pruebas preliminares de igualdad de varianzas. La Revista británica de Matemática y Estadística de la Psicología, 57(1), 173-181. https://doi.org/10.1348/000711004849222
Tratar con heterocedasticidad
Así que si tu pregunta fundamental acerca de la ubicación de las diferencias es una diferencia en el medio, entonces mi recomendación sería para el cálculo de la diferencia de medios y el uso de una prueba que puede ajustar por posibles violaciones de heterocedasticidad. El más desarrollado que requiere muy poco tiempo en la computadora (wild bootstrap es buena, pero puede tardar eones) heterocedasticidad consistente en el error estándar en la econometría. Yo recomendaría el HC3, HC4 o HC5 variantes. Ver:
- Hausman, J., & Palmer, C. (2012). Heterocedasticidad-solidez de la inferencia en muestras finitas. La Economía Letras, 116(2), 232-235. https://doi.org/10.1016/j.econlet.2012.02.007
- Cribari-Neto, F., Souza, T. C., & Vasconcellos, K. L. P. (2007). La inferencia en Heterocedasticidad y Aprovechado los Datos. Comunicaciones en Estadística - Teoría y Métodos, 36(10), 1877-1888. https://doi.org/10.1080/03610920601126589
Estos métodos son desarrollados más recientemente de la corrección de Welch y no requiere conocer la correcta especificación del modelo para la varianza. Para ejecutar una regresión de los resultados en grupo, el coeficiente es su diferencia de medias, y el robusto de corrección de error, se corrige el valor de p para heterocedasticidad. Hay métodos que permiten modelar de forma simultánea la media y la varianza como la generalizada menos plazas, pero la normalidad de los datos se vuelve en juego en relación a la prueba de la varianza. Espero que el por encima de ayuda en relación a las preguntas acerca de diferencias de medias.
La varianza de las diferencias
Breve simulación que he llevado a cabo
Yo la próxima vuelta a la otra pregunta principal sobre la varianza de las diferencias. Corrí algunas simulaciones de esta semanas atrás. Supuse que la media y la varianza de los resultados era una función de los grupos solos $-$ una simplificación de la suposición de que sería conocido en decir un ensayo aleatorizado. Yo variadas:
- la distribución de los datos, normal o sesgada ($\chi^2_8$ centrado y escalar para satisfacer la media y la varianza de los requisitos de $\approx$ desfase de 1 asintóticamente). La elección de $\chi^2$ no es ideal para la generación de los datos asimétricos especialmente bajo desequilibrado el diseño, pero creo que es suficiente.
- equilibrado versus desequilibrada de diseño (1:3, así que no es tan extrema como la de su situación).
Y el tamaño máximo de la muestra que yo consideraba era de 200 personas en ambos grupos.
He probado la capacidad de los métodos que yo consideraba mantener nominal tasa de errores y poder estadístico. Para desprender el poder de las preguntas ahora, en los tamaños de muestra por debajo de OP, la mayoría de los métodos que se muestran similar potencia estadística con respecto a la detección de la varianza de las diferencias. Pero no todos tenían la capacidad para mantener el nominal de la tasa de error. Así que cuando yo uso funcionado relativamente bien de abajo, me refiero a que mantiene nominal de la tasa de error.
La prueba de Levene, con la mediana y OLS en el cuadrado de los residuos pueden ser buenas opciones
La mayoría de manera estándar es la $F$-prueba. Pero a menos que los datos están distribuidos normalmente, esta prueba se comporta muy mal. Así que uno puede despegar de la mesa. El próximo estándar de la prueba de Levene. Si usted está preocupado acerca de la normalidad, puede robustify es mediante la realización de test de Levene prueba del uso de la mediana en lugar de la media en la fórmula para la prueba. En las simulaciones que he llevado a cabo, y este enfoque parecía a realizar relativamente bien a través de una variedad de situaciones, y debe estar disponible en los principales paquetes estadísticos. El hallazgo en mis propias simulaciones es respaldado por las recomendaciones del NIST estadística de la ingeniería del manual: https://itl.nist.gov/div898/handbook/eda/section3/eda35a.htm.
Sin embargo, también he encontrado que se pueden tomar los resultados de la primera regresión se llevó a cabo para obtener la media de las diferencias. Plaza de los residuos de esta regresión, entonces la regresión de este cuadrados residual en la variable de grupo de nuevo. He encontrado este enfoque de la prueba de la varianza de las diferencias, para realizar bien a través de todas las condiciones en mi simulación.
En resumen
Así que para recapitular, si yo estuviera en tu situación y quería hacer decisiones informadas a-priori, suponiendo la no normalidad no es extrema, me gustaría:
- realizar el estándar de la regresión del modelo de regresión de los datos de pertenencia al grupo a obtener la diferencia de medias, y el uso de heterocedasticidad coherente con los errores estándar para la inferencia
- Me gustaría conducta de Levene prueba utilizando la mediana como centro en lugar de la media. También podría utilizar la regresión de los cuadrados de los residuos de enfoque.
Otros métodos que he probado eran de Levene prueba del uso de la Hodges-Lehmann mediana (un buen estimador robusto que tiene una relación con el mencionado test de Mann-Whitney) como el centro; generalizada de los mínimos cuadrados; y tres métodos de los modelos de ecuaciones estructurales de la literatura: diagonal-mínimos cuadrados ponderados, y la media y la varianza ajustada de la OPERACIÓN, y la máxima probabilidad con un sándwich estimador comúnmente conocido como MLM. Los métodos que se centró en la mayor parte del texto fue la que ganó.