Puede que le ayude a darse cuenta de que el eje vertical se mide como densidad de probabilidad . Así, si el eje horizontal se mide en km, el eje vertical se mide como densidad de probabilidad "por km". Supongamos que dibujamos un elemento rectangular en una cuadrícula de este tipo, que tiene 5 "km" de ancho y 0,1 "por km" de alto (que tal vez prefieras escribir como "km $^{-1}$ "). El área de este rectángulo es de 5 km x 0,1 km $^{-1}$ = 0.5. Las unidades se anulan y sólo nos queda una probabilidad de la mitad.
Si cambias las unidades horizontales a "metros", tendrías que cambiar las unidades verticales a "por metro". El rectángulo tendría ahora 5000 metros de ancho, y tendría una densidad (altura) de 0,0001 por metro. Todavía te queda una probabilidad de la mitad. Puede que te moleste lo extrañas que se verán estas dos gráficas en la página comparadas entre sí (¿no tiene que ser una mucho más ancha y corta que la otra?), pero cuando estés dibujando físicamente los gráficos puedes usar la escala que quieras. Mira abajo para ver lo poco raro que tiene que ser.
Puede que le resulte útil considerar histogramas antes de pasar a las curvas de densidad de probabilidad. En muchos aspectos son análogas. El eje vertical de un histograma es densidad de frecuencia [por $x$ unidad] y las áreas representan frecuencias, de nuevo porque las unidades horizontales y verticales se cancelan al multiplicarlas. La curva PDF es una especie de versión continua de un histograma, con una frecuencia total igual a uno.
Una analogía aún más cercana es una histograma de frecuencias relativas - decimos que dicho histograma ha sido "normalizado", de modo que los elementos del área representan ahora proporciones de su conjunto de datos original en lugar de frecuencias brutas, y el área total de todas las barras es una. Las alturas son ahora densidades de frecuencia relativas [por $x$ unidad] . Si un histograma de frecuencia relativa tiene una barra que recorre $x$ de 20 km a 25 km (por lo que la anchura de la barra es de 5 km) y tiene una densidad de frecuencia relativa de 0,1 por km, entonces esa barra contiene una proporción de 0,5 de los datos. Esto se corresponde exactamente con la idea de que un elemento elegido al azar del conjunto de datos tiene una probabilidad del 50% de encontrarse en esa barra. El argumento anterior sobre el efecto de los cambios en las unidades sigue siendo válido: compara las proporciones de datos que se encuentran en la barra de 20 km a 25 km con las de la barra de 20.000 metros a 25.000 metros para estos dos gráficos. También puedes confirmar aritméticamente que las áreas de todas las barras suman uno en ambos casos.
¿Qué he querido decir con mi afirmación de que la PDF es una "especie de versión continua de un histograma"? Tomemos una pequeña franja bajo una curva de densidad de probabilidad, a lo largo de $x$ valores en el intervalo $[x, x + \delta x]$ , por lo que la franja es $\delta x$ de ancho, y la altura de la curva es una constante aproximada $f(x)$ . Podemos dibujar una barra de esa altura, cuya área $f(x) \, \delta x$ representa la probabilidad aproximada de estar en esa franja.
¿Cómo podemos encontrar el área bajo la curva entre $x=a$ y $x=b$ ? Podríamos subdividir ese intervalo en pequeñas franjas y tomar la suma de las áreas de las barras, $\sum f(x) \, \delta x$ que correspondería a la probabilidad aproximada de estar en el intervalo $[a,b]$ . Vemos que la curva y las barras no se alinean con precisión, por lo que hay un error en nuestra aproximación. Al hacer $\delta x$ cada vez más pequeño para cada barra, llenamos el intervalo con más barras y más estrechas, cuyo $\sum f(x) \, \delta x$ proporciona una mejor estimación del área.
Para calcular el área con precisión, en lugar de suponer $f(x)$ era constante en cada franja, evaluamos la integral $\int_a^b f(x) dx$ y esto corresponde a la verdadera probabilidad de estar en el intervalo $[a,b]$ . La integración sobre toda la curva da un área total (es decir, la probabilidad total) de uno, por la misma razón que la suma de las áreas de todas las barras de un histograma de frecuencias relativas da un área total (es decir, la proporción total) de uno. La integración es en sí misma una especie de versión continua de tomar una suma.
Código R para los gráficos
require(ggplot2)
require(scales)
require(gridExtra)
# Code for the PDF plots with bars underneath could be easily readapted
# Relative frequency histograms
x.df <- data.frame(km=c(rep(12.5, 1), rep(17.5, 2), rep(22.5, 5), rep(27.5, 2)))
x.df$metres <- x.df$km * 1000
km.plot <- ggplot(x.df, aes(x=km, y=..density..)) +
stat_bin(origin=10, binwidth=5, fill="steelblue", colour="black") +
xlab("Distance in km") + ylab("Relative frequency density per km") +
scale_y_continuous(minor_breaks = seq(0, 0.1, by=0.005))
metres.plot <- ggplot(x.df, aes(x=metres, y=..density..)) +
stat_bin(origin=10000, binwidth=5000, fill="steelblue", colour="black") +
xlab("Distance in metres") + ylab("Relative frequency density per metre") +
scale_x_continuous(labels = comma) +
scale_y_continuous(minor_breaks = seq(0, 0.0001, by=0.000005), labels=comma)
grid.arrange(km.plot, metres.plot, ncol=2)
x11()
# Probability density functions
x.df <- data.frame(x=seq(0, 1, by=0.001))
cutoffs <- seq(0.2, 0.5, by=0.1) # for bars
barHeights <- c(0, dbeta(cutoffs[1:(length(cutoffs)-1)], 2, 2), 0) # uses left of bar
x.df$pdf <- dbeta(x.df$x, 2, 2)
x.df$bar <- findInterval(x.df$x, cutoffs) + 1 # start at 1, first plotted bar is 2
x.df$barHeight <- barHeights[x.df$bar]
x.df$lastBar <- ifelse(x.df$bar == max(x.df$bar)-1, 1, 0) # last plotted bar only
x.df$lastBarHeight <- ifelse(x.df$lastBar == 1, x.df$barHeight, 0)
x.df$integral <- ifelse(x.df$bar %in% 2:(max(x.df$bar)-1), 1, 0) # all plotted bars
x.df$integralHeight <- ifelse(x.df$integral == 1, x.df$pdf, 0)
cutoffsNarrow <- seq(0.2, 0.5, by=0.025) # for the narrow bars
barHeightsNarrow <- c(0, dbeta(cutoffsNarrow[1:(length(cutoffsNarrow)-1)], 2, 2), 0) # uses left of bar
x.df$barNarrow <- findInterval(x.df$x, cutoffsNarrow) + 1 # start at 1, first plotted bar is 2
x.df$barHeightNarrow <- barHeightsNarrow[x.df$barNarrow]
pdf.plot <- ggplot(x.df, aes(x=x, y=pdf)) +
geom_area(fill="lightsteelblue", colour="black", size=.8) +
ylab("probability density") +
theme(panel.grid = element_blank(),
axis.text.x = element_text(colour="black", size=16))
pdf.lastBar.plot <- pdf.plot +
scale_x_continuous(breaks=tail(cutoffs, 2), labels=expression(x, x+delta*x)) +
geom_area(aes(x=x, y=lastBarHeight, group=lastBar), fill="steelblue", colour="black", size=.8) +
annotate("text", x=0.73, y=0.22, size=6, label=paste("P(paste(x<=X)<=x+delta*x)%~~%f(x)*delta*x"), parse=TRUE)
pdf.bars.plot <- pdf.plot +
scale_x_continuous(breaks=cutoffs[c(1, length(cutoffs))], labels=c("a", "b")) +
geom_area(aes(x=x, y=barHeight, group=bar), fill="steelblue", colour="black", size=.8) +
annotate("text", x=0.73, y=0.22, size=6, label=paste("P(paste(a<=X)<=b)%~~%sum(f(x)*delta*x)"), parse=TRUE)
pdf.barsNarrow.plot <- pdf.plot +
scale_x_continuous(breaks=cutoffsNarrow[c(1, length(cutoffsNarrow))], labels=c("a", "b")) +
geom_area(aes(x=x, y=barHeightNarrow, group=barNarrow), fill="steelblue", colour="black", size=.8) +
annotate("text", x=0.73, y=0.22, size=6, label=paste("P(paste(a<=X)<=b)%~~%sum(f(x)*delta*x)"), parse=TRUE)
pdf.integral.plot <- pdf.plot +
scale_x_continuous(breaks=cutoffs[c(1, length(cutoffs))], labels=c("a", "b")) +
geom_area(aes(x=x, y=integralHeight, group=integral), fill="steelblue", colour="black", size=.8) +
annotate("text", x=0.73, y=0.22, size=6, label=paste("P(paste(a<=X)<=b)==integral(f(x)*dx,a,b)"), parse=TRUE)
grid.arrange(pdf.lastBar.plot, pdf.bars.plot, pdf.barsNarrow.plot, pdf.integral.plot, ncol=2)
0 votos
Se puede cambiar la escala de $x$ eje de km a mm, pero ¿a qué equivaldría? Seguiría teniendo exactamente la misma imagen y seis ceros más para las unidades en el $x$ eje. Puedes acercar o alejar el zoom si lo deseas, pero eso no cambiaría la imagen. Mientras tanto, si la curva del pdf es una línea recta horizontal (lo que implica una distribución uniforme), su posición en el $y$ no depende de las unidades del $x$ pero sólo en la longitud del intervalo en el $x$ eje. No estoy seguro de que sea útil para ti, pero para mí la idea de acercar y alejar la imagen hace que sea más fácil de entender.
0 votos
Para entenderlo mejor, aprende más sobre el cálculo y la toma de integrales, por ejemplo, Khan Academy ofrece conferencias de introducción bastante agradables a estos temas: khanacademy.org/math/integral-calculus/
0 votos
@richard hardy ok, entonces si mi longitud de intervalo es 1 la altura de un PDF uniforme sería 1. Pero si quiero convertir la escala de, por ejemplo, m a mm, la longitud de mi intervalo se convertiría en 1000 y tendría que volver a trazar la línea a 0,001? Entonces, ¿prácticamente podría cambiar la relación de aspecto de una función sólo cambiando la unidad de medida?
2 votos
Eso parece ser cierto. Pero eso es como usar una lupa (ciertamente extraña) que aumenta en dirección horizontal por 1000 y al mismo tiempo se encoge proporcionalmente en dirección vertical. Pero la esencia de la imagen no cambiará si sólo cambia la escala.
2 votos
Esta pregunta me parece que es la misma que se planteó (de forma diferente) y se respondió en stats.stackexchange.com/questions/4220/ .
0 votos
@TheChymera: vaya, ¿de verdad querías aceptar la respuesta de Aksakal y no la de los otros dos? Está bien, pero 9 veces más personas ha votado por la respuesta de Silverfish. Depende de ti, por supuesto, pero sólo quería comprobar si era un error.
1 votos
@amoeba, Sí, aunque muchos se sientan obligados a votar por la respuesta más larga en reconocimiento al esfuerzo realizado (que yo también hice, por cierto), Aksakal respondió a mi pregunta de forma mucho más clara y sucinta. Para ser justos, yo diría que la respuesta de Silverfish también ayudó y quedaría en un cercano segundo lugar.
0 votos
@TheChymera: Ya veo. Interesante. Gracias por la respuesta.
0 votos
@amoeba ¡Mi sorpresa es que la respuesta de Aksakal no tenga más upvotes! El punto clave es cómo se estira el PDF para compensar el cambio de unidades: Yo respondí por analogía con los histogramas, esperando que les resultara más familiar, mientras que Aksakal fue directamente al grano con el PDF. Lo que sea que le dé a la OP su "momento de luz" es lo que importa, y eso es diferente para diferentes personas. Pensé que mi énfasis en cómo el área es adimensional podría resolver el problema de "en relación con qué" (¡he tenido muchos estudiantes que luchan con la idea de "área adimensional"!) pero puede que haya malinterpretado la preocupación del OP
2 votos
@amoeba Una respuesta completamente diferente podría haber sido centrarse en el hecho de que las FDP son derivadas de las FDC, por lo que el área bajo la FDP es simplemente el valor límite de la FDC, que es claramente uno, independientemente de las unidades utilizadas. Estuve tentado de incluir una breve sección sobre esto, pero me pareció que mi respuesta ya era lo suficientemente larga (y además, la clave del problema del PO parecía ser la cuestión de las unidades, que el enfoque de la FCD elude).