En el boxplot()
en R, existe la función log =
para especificar si un eje debe estar o no en la escala logarítmica.
Para mí, si elijo esta opción (especificar log = "y"
como argumento), el forma del box-plot debería tener el mismo aspecto que si transformara manualmente los datos primero con el logaritmo, y luego trazara esos datos transformados por el logaritmo (reconozco que las etiquetas en el eje serán diferentes, pero me refiero al forma de la parcela). Sin embargo, este no es el caso.
He aquí un sencillo ejemplo de trabajo:
set.seed(923489)
data <- rlnorm(300, meanlog = 0, sdlog = 1)
boxplot(data) # Highly skewed right raw data
boxplot(data, log="y") # Data on log scale; less right-skewed
boxplot(log10(data)) # Log base 10-transform data; shape not the same as when specify log="y"
boxplot(log(data)) # Natural log and base 10 give same shape plot (just different axis labels)
¿Por qué?
2 votos
Uno calcula el boxplot en unidades originales y luego lo dibuja en la escala logarítmica, el otro calcula el boxplot en la escala logarítmica y luego lo dibuja. Las dos cosas son diferentes cada vez que se obtiene algo que no se basa puramente en los cuantiles individuales (los cercos, y por lo tanto los bigotes se basan en funciones lineales de los cuantiles)