¿Cuál es la razón de que una función de probabilidad no es un pdf (función de densidad de probabilidad)?
Respuestas
¿Demasiados anuncios?Vamos a empezar con dos definiciones:
Una función de densidad de probabilidad (pdf) es un no-negativo de la función que se integra a $1$.
La probabilidad se define como el conjunto de la densidad de los datos observados como una función del parámetro. Pero, como se ha señalado por la referencia a Lehmann hecha por @whuber en un comentario más abajo, la función de probabilidad es una función del parámetro sólo, con los datos que se celebró como una constante fija. Así que el hecho de que es una densidad como función de los datos es irrelevante.
Por lo tanto, la probabilidad de la función no es un pdf porque su integral con respecto al parámetro no es necesariamente igual a 1 (y no puede ser integrable en todo, en realidad, como señaló otro comentario de @whuber).
Para ver esto, vamos a utilizar un ejemplo sencillo. Suponga que tiene una única observación, $x$, ${\rm Bernoulli}(\theta)$ distribución. Entonces la función de probabilidad es
$$ L(\theta) = \theta^{x} (1 - \theta)^{1-x} $$
Es un hecho que $\int_{0}^{1} L(\theta) d \theta = 1/2$. Específicamente, si $x = 1$,$L(\theta) = \theta$, lo $$\int_{0}^{1} L(\theta) d \theta = \int_{0}^{1} \theta \ d \theta = 1/2$$
y un cálculo similar se aplica al $x = 0$. Por lo tanto, $L(\theta)$ no puede ser una función de densidad.
Tal vez aún más importante que esta técnica de ejemplo que muestra por qué la probabilidad no es una densidad de probabilidad, es señalar que la probabilidad es que no la probabilidad de que el valor del parámetro correcto ni nada de eso - se trata de la probabilidad (densidad) de los datos dado el valor del parámetro, que es una cosa completamente diferente. Por lo tanto, uno no debe esperar que la probabilidad de la función que se comportan como una densidad de probabilidad.
Yo no soy un estadístico, pero mi entendimiento es que mientras que la probabilidad de la función en sí no es un PDF con respecto al parámetro(s), que está directamente relacionado con el PDF por la Regla de Bayes. La función de probabilidad, P(X|theta), y posterior distribución, f(theta|X), que están estrechamente vinculados; no es "una cosa completamente diferente".