70 votos

¿Cuándo son apropiadas las escalas Log?

He leído que el uso de escalas logarítmicas en la elaboración de gráficos es apropiado en determinadas circunstancias, como el eje Y en un gráfico de series temporales. Sin embargo, no he podido encontrar una explicación definitiva de por qué es el caso, o cuándo más sería apropiado. Por favor, tenga en cuenta que no soy un estadístico, así que puede que no entienda nada, y si ese es el caso, le agradecería que me indicara los recursos necesarios para remediarlo.

10 votos

Esta no es una respuesta formal, pero cuando una variable abarca varios órdenes de magnitud, a menudo es más fácil para los ojos (y más informativo) visualizarla en la escala logarítmica.

0 votos

Macro-eso tiene mucho sentido (¡sobre todo cuando tienes un público que puede entenderlo!)

1 votos

Puede que este hilo estrechamente relacionado le resulte útil mientras espera respuestas específicas: stats.stackexchange.com/questions/298 . En términos de gráficos, se puede interpretar fructíferamente la "variable dependiente" como el "eje Y". A continuación, observe el muchas preguntas estrechamente relacionadas que han aparecido aquí.

67voto

Auron Puntos 2123

Se trata de una cuestión muy interesante, en la que muy poca gente piensa. Hay varias formas diferentes en las que una escala logarítmica puede ser apropiada. La primera y más conocida es la mencionada por Macro en su comentario: las escalas logarítmicas permiten mostrar un gran rango sin que los valores pequeños queden comprimidos en el fondo del gráfico.

Otra razón para preferir una escala logarítmica es en circunstancias en las que los datos se expresan más naturalmente de forma geométrica. Un ejemplo es cuando los datos representan la concentración de un mediador biológico. Las concentraciones no pueden ser negativas y la variabilidad casi siempre escala con la media (es decir, hay varianza heteroscedástica). El uso de una escala logarítmica o, de forma equivalente, el uso del logaritmo de la concentración como medida principal "fija" la variabilidad desigual y da una escala sin límites en ambos extremos. Las concentraciones se distribuyen probablemente de forma logarítmica normal, por lo que una escala logarítmica nos da un resultado muy conveniente que podría considerarse "natural". En farmacología utilizamos una escala logarítmica para las concentraciones de los fármacos con mucha frecuencia, y en muchos casos las escalas lineales son sólo el producto de los no-farmacólogos que hacen sus pinitos con los fármacos ;-)

Otra buena razón para una escala logarítmica, probablemente la que le interesa para los datos de series temporales, proviene de la capacidad de una escala logarítmica para hacer equivalentes los cambios fraccionarios. Imagine una visualización del rendimiento a largo plazo de sus inversiones para la jubilación. Debería crecer de forma exponencial porque los intereses de mañana dependen de la inversión de hoy (a grandes rasgos). Así, aunque el rendimiento en términos porcentuales haya sido bastante constante, un gráfico de los fondos parecerá haber crecido más rápidamente en el extremo derecho. Con una escala logarítmica, un cambio porcentual constante se ve como una distancia vertical constante, por lo que una tasa de crecimiento constante se ve como una línea recta. Esto suele ser una ventaja sustancial.

Otra razón un poco más esotérica para elegir una escala logarítmica se da en circunstancias en las que los valores pueden expresarse razonablemente como x o 1/x. Un ejemplo de mi propia investigación es la resistencia vascular, que también puede expresarse razonablemente como su recíproco, la conductancia vascular. (También es sensato, en algunas circunstancias, pensar en el diámetro de los vasos sanguíneos que escala como una potencia de la resistencia o conductancia). Ninguna de esas medidas tiene más realidad que la otra y ambas pueden encontrarse en los trabajos de investigación. Si se escalan logarítmicamente, son simplemente el negativo de la otra y la elección de una u otra no supone ninguna diferencia sustantiva. (El diámetro vascular se diferenciará de la resistencia y la conductancia por un multiplicador constante cuando se escalen logarítmicamente).

0 votos

Gracias por la gran respuesta. Sin embargo, ¿podrías detallar lo de "los valores pueden expresarse razonablemente como x"?

4 votos

@ktdrv Hay cosas que tienen sentido tanto para arriba como para abajo. Digamos que quieres documentar la habilidad de un pescador. Puedes contar el número de peces capturados por día o puedes medir el intervalo entre capturas sucesivas. Cualquiera de las dos medidas tiene sentido, pero están relacionadas de forma no lineal entre sí. Son recíprocas a escala la una de la otra y, por lo tanto, se pueden convertir una en la otra. El logaritmo del intervalo y el logaritmo del número por día están relacionados linealmente entre sí y difieren por un factor constante (negativo).

1 votos

Michael, gracias por la gran respuesta. Tengo que admitir que me ha llevado un tiempo analizar todos tus puntos (y he tenido que buscar en Google algunos términos, como "varianza heteroscedástica"). Todavía estoy tratando de entender exactamente el impacto real de la respuesta en mi trabajo, pero estoy agradecido por la dirección general y algunas directrices que me indican el camino.

38voto

Ted Puntos 854

Algunos ejemplos de la vida real que tenía a mano como complemento a la muy buena respuesta de @Michael Lew.

En primer lugar, los dos gráficos de series temporales que aparecen a continuación muestran las llegadas mensuales de visitantes a Nueva Zelanda, disponibles en Estadísticas de Nueva Zelanda . Ambos gráficos tienen su utilidad, pero el del eje vertical en escala logarítmica me parece espectacularmente útil para muchos más propósitos que el primero. Por ejemplo, se puede ver que la estacionalidad de las llegadas sigue siendo aproximadamente proporcional a la escala de las llegadas; y se pueden ver los cambios significativos en la tasa de crecimiento (por ejemplo, durante la segunda guerra mundial) que son simplemente invisibles en la escala original.

enter image description here

En segundo lugar, los gráficos siguientes muestran el gasto total relacionado con el viaje de los turistas a Nueva Zelanda, comparado con el gasto mientras están realmente en Nueva Zelanda. La fuente es el Encuesta de visitantes internacionales por el Ministerio de Desarrollo Económico. La diferencia es el gasto previo al viaje, por ejemplo, hoteles o paquetes pagados por adelantado. El primer gráfico, en la escala original, puede utilizarse para pocos fines, aparte de una impresión muy burda (pero importante) de los datos que se agrupan en la esquina inferior izquierda. El segundo gráfico sacrifica algo de la interpretabilidad inmediata, sobre todo para los que no son estadísticos (por eso, normalmente ahora utilizaría una escala logarítmica en los ejes, en lugar de transformar los datos y hacer que la escala muestre el valor logarítmico), pero ofrece mucha más diferenciación visual.

Por ejemplo, se pueden detectar claramente los pocos valores atípicos (que resultaron ser errores de edición de datos) en los que el gasto total fue inferior al gasto en Nueva Zelanda. Y lo que es más importante, se puede utilizar este gráfico con diferentes colores o facetas para mostrar cómo los diferentes países del mercado o el propósito de la visita (por ejemplo, las vacaciones frente a la visita a amigos y familiares) ocupan diferentes partes del "espacio" de gasto, algo que sería invisible en los ejes originales.

Para convertir este gráfico en algo útil, habría que tratar de alguna manera los datos de alta densidad (por ejemplo, añadiendo algo de transparencia a los puntos, o sustituyendo los puntos por franjas hexagonales coloreadas según la densidad), pero cualquier solución visual útil implicará, casi con toda seguridad, ejes logarítmicos.

enter image description here

editar / añadir

Otro gráfico para ilustrar lo que quería decir con las franjas hexagonales, utilizando el color para representar la densidad cuando hay un gran conjunto de datos (en este caso, unos 12.000 participantes en una encuesta sobre las experiencias de la Copa del Mundo de Rugby en Nueva Zelanda). Nótese de nuevo que este es otro ejemplo en el que he utilizado una escala logarítmica para el gasto.

enter image description here

0 votos

Peter, gracias por la información adicional; los gráficos ayudan realmente a entender tus puntos. Una pregunta complementaria (si te apetece), ¿por qué sustituyes los puntos por recipientes "hexagonales"? ¿Es la misma idea que los "Sunflower Plots"? No había oído ese término antes.

0 votos

No, diferente a las parcelas de girasol. Se trata de dividir el área de ploteo en cubos hexagonales y luego colorearlos (por ejemplo, de claro a oscuro) según el número de puntos que haya en cada cubo. Puede ser una buena manera de evitar el trazado de grandes conjuntos de datos que, de otro modo, tienden a convertirse en una masa de negro.

0 votos

(el resto del comentario) @PeterEllis Gracias por la aclaración. Esa es una gran manera de visualizar los datos, es muy similar a los mapas de calor geográficos que utilizo. ¿Lo has creado en R?

10voto

RobW Puntos 1798

Otra cosa ingeniosa de las escalas logarítmicas es que hacen que las relaciones parezcan simétricas. Por ejemplo, así: enter image description here

12 votos

Sería bueno ver el mismo gráfico en una escala lineal, para comparar

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X