26 votos

¿Es una transformación del registro una técnica válida para datos no-normal prueba t?

En la revisión de un documento, el estado de los autores, "las variables de resultado continuas exhibe una distribución sesgada se transformaron, utilizando el logaritmo natural, antes de que se realizaron pruebas t para satisfacer los requisitos previos supuestos de normalidad."

¿Es una forma aceptable para analizar los datos no normales, particularmente si la distribución subyacente no es necesariamente lognormal?

Esto puede ser una pregunta muy tonta, pero no he visto esto antes...

12voto

phloopy Puntos 4285

Es común tratar de aplicar algún tipo de transformación a la normalidad (utilizando, por ejemplo, logaritmos, raíces cuadradas, ...) cuando se encuentra con datos que no es normal. Mientras que el logaritmo de los rendimientos de los buenos resultados de los datos asimétricos razonablemente a menudo, no hay ninguna garantía de que funcionará en este caso en particular. También debe tenerse @whubers comentario anterior en mente a la hora de analizar datos transformados: "Un t-test para los logaritmos no es el mismo que el de un t-test para datos sin transformar ni una no paramétrica de la prueba. La prueba t-test en los registros compara geométrico medio, no el (como es habitual) media aritmética."

Las transformaciones a la normalidad, siempre debe ser seguido por una investigación de la normalidad asunción, para evaluar si los datos transformados se ve "bastante normal". Esto se puede hacer usando, por ejemplo, histogramas, QQ-parcelas y pruebas de normalidad. La prueba de t es particularmente sensible a las desviaciones de la normalidad en forma de asimetría y, por tanto, una prueba de normalidad que se dirige hacia sesgar las alternativas sería preferible. Pearson muestra la asimetría $\frac{n^{-1}\sum_{i=1}^n(x_i-\bar{x})^3}{(n^{-1}\sum_{i=1}^n(x_i-\bar{x})^2)^{3/2}}$ es un ensayo adecuado de la estadística en este caso.

En lugar de elegir una transformación (como logaritmos) porque funciona la mayoría del tiempo, yo prefiero usar el de Box-Cox procedimiento para la elección de una transformación en el uso de los datos. Sin embargo, hay algunas cuestiones filosóficas con este; en particular, si esto debería afectar el número de grados de libertad en el t-test, ya que hemos utilizado la información de la muestra a la hora de escoger transformar a utilizar.

Finalmente, una buena alternativa al uso de la prueba t-test después de una transformación o una clásica no paramétrica, la prueba es utilizar el bootstrap analógica de la prueba t-test. No requiere la suposición de normalidad y es una prueba acerca de la no transformadas significa (y no de otra cosa).

-1voto

chitti Puntos 134

En general si los supuestos necesarios para llevar a cabo una prueba de t no se cumplen, entonces sería más apropiado utilizar una prueba no paramétrica.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X