Las transformaciones logarítmicas con desplazamientos son casos especiales de la Transformaciones Box-Cox :
$y(\lambda_{1}, \lambda_{2}) = \begin{cases} \frac {(y+\lambda_{2})^{\lambda_1} - 1} {\lambda_{1}} & \mbox{when } \lambda_{1} \neq 0 \\ \log (y + \lambda_{2}) & \mbox{when } \lambda_{1} = 0 \end{cases}$
Se trata de la forma ampliada para los valores negativos, pero también es aplicable a los datos que contienen ceros. Box y Cox (1964) presentan un algoritmo para encontrar valores adecuados para el $\lambda$ utilizando la máxima probabilidad. Esto le da la última transformación.
Una razón para preferir las transformaciones Box-Cox es que están desarrolladas para asegurar los supuestos del modelo lineal. Hay algunos trabajos que demuestran que incluso si sus datos no pueden ser transformados a la normalidad, entonces el estimado $\lambda$ todavía conducen a una distribución simétrica.
No estoy seguro de que esto responda a sus datos, ya que podría ser que $\lambda = (0, 1)$ que no es más que la transformación logarítmica que mencionas, pero puede valer la pena estimar la $\lambda$ 's para ver si otra transformación es apropiada.
En R, el boxcox.fit
función en el paquete geoR
calculará los parámetros por ti.
29 votos
He resumido algunas de las respuestas y otro material en robjhyndman.com/researchtips/transformations
5 votos
¡excelente manera de transformar y promover stat.stackoverflow !
1 votos
Sí, estoy de acuerdo @robingirard (¡acabo de llegar aquí por la entrada del blog de Rob)!
1 votos
Ver también stats.stackexchange.com/questions/39042/ para una aplicación a datos censurados por la izquierda (que pueden caracterizarse, hasta un cambio de ubicación, exactamente como en la presente pregunta).
0 votos
Esta Q también es relevante para esta discusión: Qué cantidad tan pequeña debe añadirse a x para no tomar el logaritmo de cero .
3 votos
Parece extraño preguntar sobre cómo transformarse sin haber planteado el propósito de la transformación en primer lugar. ¿Cuál es la situación? ¿Por qué es necesario transformarse? Si no sabemos lo que se quiere conseguir, ¿cómo se puede sugerir razonablemente cualquier cosa ? (Está claro que no se puede esperar una transformación a la normalidad, porque la existencia de una probabilidad (no nula) de ceros exactos implica un pico en la distribución en el cero, pico que ninguna transformación eliminará, sólo podrá desplazarlo).
0 votos
He estado jugando con log(x+d)-c, donde c=floor(log(smallest-non-zero-value)), y d=exp(c). Esto también tiene la característica de que 0 se asigna a 0. Sin embargo, he estado tratando de interpretar los coeficientes resultantes de este modelo, y he estado teniendo problemas - En particular, la característica de un modelo log-lineal en un predictor continuo X donde un cambio de 1 unidad en X resulta en el mismo cambio porcentual en Y, independientemente de la elección de X y X + 1 - esto ya no parece mantenerse debido al pequeño ajuste. Por esta razón, empiezo a sospechar que las transformaciones alternativas que se presentan a continuación son superiores.