Deje ${\displaystyle p_{\text{H}}}$ la probabilidad de que
una cierta moneda cae de cabeza hasta (H) cuando tiró. Así, la probabilidad de
de tener dos cabezas en dos lanzamientos (HH) es de ${\displaystyle
p_{\text{H}}^{2}}$. If ${\displaystyle
p_{\text{H}}=0.5}$, entonces la probabilidad de ver dos cabezas es de 0,25:
$${\displaystyle P({\text{HH}}\mid p_{\text{H}}=0.5)=0.25.}$$
Con esto, podemos decir que la probabilidad de ${\displaystyle
p_{\text{H}}=0.5}$, dada la observación de la HH, es de 0,25, que es
$${\displaystyle {\mathcal {L}}(p_{\text{H}}=0.5\mid
{\text{HH}})=P({\text{HH}}\mid p_{\text{H}}=0.5)=0.25.}$$
Esto no es lo mismo que decir que la probabilidad de que
${\displaystyle p_{\text{H}}=0.5}$, dada la observación de la HH, es
$0.25$. Para eso, podemos aplicar el teorema de Bayes, lo que implica que
la probabilidad posterior (densidad) es proporcional a la probabilidad de
veces la probabilidad anterior. [Wikipedia Ejemplo 1 en la Probabilidad de
función]
Esta Wikipedia Ejemplo indica exactamente lo que debe:
la probabilidad (función de) $$\mathcal{L}(\theta|x)$$ as a function of $\theta$ indexed by the realised observation $x$, takes an image value at a particular value of the parameter (like $\theta={\displaystyle p_{\text{H}}=0.5}$) that is the value of the sampling distribution (pmf or pdf) at the observed sample for that value of the parameter $$p(x|\theta).$$
El párrafo final es una advertencia de que un valor de probabilidad o la función no es en general un valor de probabilidad o de densidad de masa de la función en el parámetro. Para activar la función de probabilidad en una función de densidad, el espacio de parámetros debe ser dotado con una probabilidad de la estructura, incluyendo una distribución previa/medida, que convierte el muestreo de densidad de probabilidad en una condicional de densidad de probabilidad.
La última frase siempre se podía convertirse en algo más clara, como
Para producir una probabilidad declaración de un valor del parámetro, uno
necesita considerar este parámetro como una variable aleatoria, la cual requiere
una medida de probabilidad en el espacio de parámetros, llamado antes
de distribución. Con este paso, uno se aplica el teorema de Bayes,
la definición de la probabilidad posterior (densidad) en el parámetro como
proporcional a la probabilidad de los tiempos de la probabilidad anterior.