(Esta respuesta toma como punto de partida la pregunta del OP en los comentarios, "Permítanme entender la masa antes de ir a la densidad. ¿Por qué llamamos masa a un punto de la distribución discreta? ¿Por qué no podemos llamarlo simplemente punto?")
Sin duda podríamos llamarlo un punto. La utilidad del término "función de masa de probabilidad", sin embargo, es que nos dice algo sobre cómo la función en el entorno discreto se relaciona con la función en el entorno continuo debido a las asociaciones que ya tenemos con "masa" y "densidad". Y creo que para entender por qué utilizamos estos términos en primer lugar tenemos que empezar con lo que llamamos la función de densidad. (De hecho, no estoy seguro de que siquiera utilizáramos "masa de probabilidad" sin la correspondiente función de "densidad de probabilidad").
Supongamos que tenemos una función $f(x)$ que aún no hemos nombrado pero sabemos que $\int_a^b f(x) dx$ da la probabilidad de que veamos un resultado entre $a$ y $b$ . ¿Cómo deberíamos llamar $f(x)$ ? ¿Cuáles son sus propiedades? Empecemos por sus unidades. Sabemos que, en general, las unidades en una integral definida $\int_a^b f(x) dx$ son las unidades de $f(x)$ veces las unidades de $dx$ . En nuestro entorno, la integral da una probabilidad, y $dx$ tiene unidades en digamos, longitud. Así que las unidades de $f(x)$ debe ser la probabilidad por unidad de longitud. Esto significa que $f(x)$ debe estar diciéndonos algo sobre cuánta probabilidad se concentra por unidad de longitud cerca de $x$ es decir, cómo denso la probabilidad es cercana a $x$ . Así que tiene sentido llamar a $f(x)$ una "función de densidad de probabilidad". (De hecho, una forma de ver $\int_a^b f(x) dx$ es que, si $f(x) \geq 0$ , $f(x)$ es siempre una función de densidad. Desde este punto de vista, la altura es densidad de área, el área es densidad de volumen, la velocidad es densidad de distancia, etc. Uno de mis colegas utiliza un enfoque como éste cuando habla de las aplicaciones de la integración en cálculo de segundo semestre).
Ahora que hemos nombrado $f(x)$ una función de densidad, ¿cómo deberíamos llamar a la función correspondiente en el entorno discreto? No es una función de densidad; sus unidades son la probabilidad y no la probabilidad por unidad de longitud. Entonces, ¿qué es? Bueno, cuando decimos "densidad" sin calificativo normalmente estamos hablando de "densidad de masa", y cuando integramos una función de densidad sobre un objeto obtenemos la masa de ese objeto. Teniendo esto en cuenta, la relación entre la función de probabilidad en el entorno continuo y la de la función de probabilidad en el entorno discreto es exactamente la de densidad a masa. Por tanto, "función de masa de probabilidad" es un término natural para aplicar a la función discreta correspondiente.
0 votos
No estoy del todo seguro de entender su pregunta, pero densidad no es igual a área bajo la curva. Si tomamos la interpretación de área de la probabilidad, la densidad (es decir, la función de densidad de probabilidad) se interpreta como una altura. Así que las unidades ni siquiera son las mismas. ¿Quizá parte de tu confusión se deba a eso?
0 votos
@Mike: Permíteme entender la masa antes de pasar a la densidad. ¿Por qué llamamos masa a un punto de la distribución discreta? ¿Por qué no podemos llamarlo simplemente punto?