Necesito realizar un ANOVA de dos vías en mis datos. Mis datos proceden de una población no normal. Al parecer, no existe ninguna prueba de dos o tres factores para poblaciones no normales. Me he dado cuenta de que necesito transformar mis datos, pero no estoy seguro de qué transformación realizar en mis datos, no sé cuál es la más apropiada. ¿No sé cuál es el criterio para elegir una de la lista de posibilidades de transformación?
Respuestas
¿Demasiados anuncios?Transformación que cambiará la forma deja de comparar los medios. Si realmente desea comparar las medias, es posible que desee evitar la transformación (puede haber algunas excepciones particulares en las que, al menos con algunos supuestos de acompañamiento, puede calcular o aproximar las medias en la escala original también).
Si no necesita una estimación de la diferencia de medias en la escala original (es decir, si los tamaños del efecto no son críticos para su análisis), los modelos factoriales completos (es decir, con todas las interacciones presentes) pueden funcionar suficientemente bien con la transformación.
Si le satisfacen comparaciones de localización más generales que las meras medias, existen otras alternativas además de la transformación.
Si usted do quiere comparar significa que hay otras alternativas además de la transformación. No estoy diciendo "no utilices nunca la transformación"... sino "considera alternativas".
Al parecer, no existe ninguna prueba de dos o tres factores para poblaciones no normales.
Esto es falso. Podría hacerse con GLM, por ejemplo. O mediante remuestreo.
La no normalidad puede no ser el mayor problema (la heteroscedasticidad suele tener un mayor impacto, que no disminuye tan bien con el tamaño de la muestra).
Una transformación no lineal cambiará muchas cosas. En su caso, las más importantes son la forma de la distribución, la varianza de las variables transformadas y la correspondencia de las medias en la escala transformada con la escala original y viceversa. (En una situación de regresión también está el impacto en la linealidad de las relaciones).
Puedes elegir una transformación que te lleve a una varianza casi constante. Puedes elegir una que te lleve a una simetría cercana. Usted podría elegir uno que hace cualquiera de esas cosas menos bien, pero es más interpretable.
Si tienes mucha suerte, puede que te encuentres en una situación que te dé más de uno de esos a la vez.
Pero, de nuevo, mi consejo es que primero consideres alternativas. Como primer paso, podría investigar qué se podría hacer con los MLG.
¿Cuáles son las características de sus datos? ¿Por qué dices que no son normales? ¿Hay recuentos? ¿Están los datos muy sesgados*?
* Tenga en cuenta que lo importante no es la distribución incondicional de la respuesta, sino la distribución condicional.
Observa la distribución de tus datos mediante un histograma y, a continuación, comprueba a qué tipo de distribución se parecen. Por ejemplo, si los datos están muy sesgados hacia el extremo inferior de la escala, es posible que se beneficien de una transformación logarítmica (10):
Una transformación logarítmica de estos datos los haría al menos cercanos a la normalidad. Este ejemplo concreto puede encontrarse en aquí .
Examine la distribución de sus datos de resultados y, a continuación, elija la transformación adecuada.