En general, si usted tiene dos mediciones diferentes en cada uno de un conjunto de observaciones, y se sospecha que puede haber una relación entre ellos, creo que es mejor para visualizarlos con un diagrama de dispersión. No sé si usted usa R
, pero aquí es un código muy simple y una muestra de la parcela:
speed = c(2.2, 4.7, 7.3, 3.1)
weight = c(500, 222, 999, 1000)
windows()
plot(speed, weight)
Esta trama no parece muy emocionante, sobre todo porque sólo tiene 4 puntos de datos.
Otra forma de visualizar los datos es usar un dotplot. Esta es una buena manera de ver los datos que representan simple magnitudes, que es lo que tiene, si se busca en sólo una de las variables. Tenga en cuenta que esto es lo mismo que un gráfico de barras proporciona, es sólo que dotplots han demostrado ser más fácil para la gente para extraer la información. La pregunta es, ¿puede usted mirar dos variables al mismo tiempo de tal manera que quizás podría ver las relaciones, pero sin redundancia?
Una manera de lidiar con este problema general es la trama de dos variables en la misma parcela (en este caso, el mismo dotplot). Este tipo de cosas es muy comúnmente se realiza con datos de series de tiempo en economía (he aquí que yo he encontrado a través de Google). El truco es encontrar una manera de conseguir dos escalas diferentes en la misma parcela. Esto puede ser hecho por un reescalado una de las variables en términos de la otra; además, debe ajustar la escala del eje de valores de la otra variable en los términos de la primera. Estos 'rescalings' debe ser lineal transformaciones a fin de no cambiar los datos de una manera significativa. El siguiente es el R
código que hace esto de una manera que es increíblemente kluge-y, pero que espero sean fáciles de seguir:
sM = mean(speed); wM = mean(weight)
sSD = sd(speed); wSD = sd(weight)
weightZ = (weight-wM) / wSD
convertedW = (weightZ*sSD) + sM
sTicks = c(0:8)
sTicksZ = (sTicks-sM) / sSD
convertedST = (sTicksZ*wSD) + wM
convertedST = round(convertedST)
sY = seq(from=1.1, to=4.1, by=1)
wY = seq(from=0.9, to=3.9, by=1)
windows()
plot(speed, sY, pch=1, col="red", axes=F, xlab="", ylab="", ylim=c(0.5, 4.5), xlim=c(0,8))
points(convertedW, wY, pch=2, col="blue")
abline(h=c(1:4), lty="dashed", col="lightgray")
box()
axis(side=2, at=c(1:4), labels=c("a","b","c","d"))
axis(side=3, at=sTicks, col="red")
axis(side=1, at=sTicks, labels=convertedST, col="blue")
mtext("Speed", side=3, line=2.5, cex=1.5, col="red")
mtext("Weight", side=1, line=2.5, cex=1.5, col="blue")
legend("bottomright", legend=c("Speed", "Weight"), pch=c(1,2), col=c("red","blue"))
Con pequeñas cantidades de datos, como los que tenemos aquí, este puede ser más informativo.