Entiendo las transformaciones de Box-Cox, cuándo aplicar qué transformación (logarítmica vs exponencial) y sobre qué tipo de distribución (asimétrica izquierda vs derecha). Sin embargo, lo que no entiendo es cuándo es apropiado considerar las transformaciones en primer lugar.
Respuesta
¿Demasiados anuncios?Esto es realmente demasiado amplio, ni siquiera nos has dicho cuál es tu propósito al modelar, ¡y una respuesta seguramente debe depender de eso! Hay un montón de preguntas y respuestas relevantes aquí, una lista corta:
- Estabilizar la varianza: ¿Por qué estabilizamos la varianza?
- Transformar y luego utilizar un modelo lineal podría ser más sencillo de presentar a ciertos públicos que utilizar un MLG: ¿Por qué el GLM es diferente de un LM con variable transformada?
- La modelización de series temporales es más sencilla con una varianza constante: Cuándo transformar logarítmicamente una serie temporal antes de ajustar un modelo ARIMA
- Hay muchas razones para utilizar una transformada de registro: En la regresión lineal, ¿cuándo es apropiado utilizar el logaritmo de una variable independiente en lugar de los valores reales? y ¿Cuándo (y por qué) hay que tomar el logaritmo de una distribución (de números)?
- Algunas ideas sobre transformaciones y aprendizaje automático: ¿Por qué no se enseñan mucho las transformaciones de potencia o de registro en el aprendizaje automático?
- Para satisfacer los supuestos de modelización: En la práctica, ¿cómo se maneja el ANOVA cuando los datos no cumplen los supuestos?
- Por qué (o no) utilizar la transformada de raíz cuadrada: ¿Por qué se recomienda la transformación de raíz cuadrada para los datos de recuento?
- ¿Es realmente una buena idea transformar los datos binomiales en arcoseno? ¿Son los ecologistas los únicos que no sabían que la arcosina es asín? o ¿Puedo utilizar un modelo binomial con función de enlace logit cuando se trata de proporciones continuas?
- Por qué utilizar la transformación de Box-Cox: ¿Cómo es válida la transformación box cox? y Transformadas de caja de Cox para la regresión
- Transformaciones y análisis de componentes principales: ¿Por qué transformar los datos en logaritmos antes de realizar el análisis de componentes principales?
- Una buena alternativa para transformar las variables predictoras en modelos de regresión es el uso de splines . Se pueden encontrar ejemplos en Ayúdame a ajustar esta regresión múltiple no lineal que ha desafiado todos los esfuerzos anteriores
... y seguramente muchas otras razones. Para obtener una respuesta más específica tendrá que contarnos más sobre su situación. Para encontrar más posts relevantes aquí, busque en este sitio "por qué transformarse" o para limitar el número de resultados "por qué transformarse puntuación:10.." resultado (o alguna variante).