6 votos

¿Debe informarse de los datos no transformados cuando se realiza un ANOVA con datos transformados?

Estoy tratando de entender cómo analizar los datos transformados utilizando ANOVA.

Si mis datos no cumplen el supuesto de normalidad, y los he transformado utilizando una transformación logarítmica para solucionarlo, ¿podría entonces realizar mi análisis con las puntuaciones transformadas y citar los valores transformados?

Editar: Más concretamente, cuando se han transformado los datos para que cumplan el supuesto de normalidad y luego se ejecuta un ANOVA de una vía sobre las puntuaciones transformadas, si se quieren representar gráficamente los datos, ¿se deben utilizar también las puntuaciones transformadas o las medias originales? Dado que el gráfico ilustra la relación entre las variables, yo diría que hay que utilizar los valores transformados.

5voto

Esto depende de varias cosas. El análisis se realizó dentro del espacio de transformación, por lo que presentar los datos retrotransformados puede distorsionar las cosas (las medias no transformadas son sencillamente erróneas, pero volver a convertirlas en transformadas después de resumirlas, las medias, la varianza, etc. podría estar bien en ciertas situaciones). Supongo que lo primero que haría es ver cómo se ve cuando se hace la retrotransformación. ¿La retrotransformación cuenta exactamente lo mismo que los datos transformados? Si es así, probablemente esté bien presentarlo así. Si no es así, hay que presentar el resumen transformado.

Incluso si realiza la retrotransformación, debe dejar claro en la sección de resultados que el análisis se aplica a la transformación. Dices: "encontramos efectos significativos en el logaritmo de los datos", etc.

De todos modos, algunas transformaciones son variaciones de una medida arbitraria. Por ejemplo, se puede medir el tiempo de reacción en segundos y tener una media de 0,5. Normalmente, este tipo de datos tiene una cola hacia la derecha y, a veces, se puede normalizar simplemente tomando la inversa, por lo que ahora la media es de 2 respuestas por segundo. Es difícil argumentar que cualquiera de los dos represente de forma más significativa lo sucedido y además ambos son directamente expresivos y fáciles de interpretar.

Otra cosa que hay que tener en cuenta es que a veces los datos transformados son realmente más significativos. A veces es necesario transformar los datos parcialmente porque la transformación es la expresión más natural de la variable de respuesta.

Probablemente hay muchas cosas a tener en cuenta que ni siquiera he mencionado. Si te resulta difícil decidirte para tu problema concreto, haz la pregunta concreta sobre el tipo exacto de datos que tienes.

2voto

Sean Hanley Puntos 2428

@John tiene una muy buena respuesta aquí. Sólo quiero añadir un punto ortogonal. Tener datos con distribución normal no es tan importante como mucha gente cree. El Teorema de Gauss-Markov nos dice que no es necesario para la estimación del modelo. La normalidad es necesaria para $p$ -valores para ser precisos con baja $N$ (es decir, $p$ -serán correctos, incluso con datos no normales, si $N$ es suficientemente alta). Si $N$ es baja, entonces querrá hacer un bootstrap de sus errores estándar / $p$ -valores.

Las transformaciones se realizan a menudo porque los datos son más significativos/interpretables en esa escala o para corregir la heterogeneidad de la varianza (un problema más importante que la no normalidad). Por ejemplo, John utilizó los tiempos de reacción como ejemplo. Es bien sabido que la desviación estándar de los tiempos de reacción aumenta a medida que aumenta la media. Tomar el logaritmo estabiliza la varianza.

0voto

Julien Chastang Puntos 161

Dependerá de su aplicación, pero en las ciencias biológicas se aconseja presentar las medias no transformadas, ya que suelen ser más interpretables que las transformadas

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X