Consideremos un vector de parámetros $(\theta_1, \theta_2)$ con $\theta_1$ el parámetro de interés, y $\theta_2$ un parámetro molesto.
Si $L(\theta_1, \theta_2 ; x)$ es la probabilidad construida a partir de los datos $x$ la probabilidad del perfil para $\theta_1$ se define como $L_P(\theta_1 ; x) = L(\theta_1, \hat{\theta}_2(\theta_1) ; x)$ donde $ \hat{\theta}_2(\theta_1)$ es la MLE de $\theta_2$ para un valor fijo de $\theta_1$ .
$\bullet$ Maximizar la probabilidad del perfil con respecto a $\theta_1$ conduce a la misma estimación $\hat{\theta}_1$ como la que se obtiene al maximizar la probabilidad simultáneamente con respecto a $\theta_1$ y $\theta_2$ .
$\bullet$ Creo que la desviación estándar de $\hat{\theta}_1$ también puede estimarse a partir de la segunda derivada de la probabilidad del perfil.
$\bullet$ La estadística de probabilidad para $H_0: \theta_1 = \theta_0$ puede escribirse en términos de la probabilidad del perfil: $LR = 2 \log( \tfrac{L_P(\hat{\theta}_1 ; x)}{L_P(\theta_0 ; x)})$ .
Así pues, parece que la probabilidad del perfil puede utilizarse exactamente como si fuera una probabilidad genuina. ¿Es realmente así? ¿Cuáles son los principales inconvenientes de este enfoque? ¿Y qué pasa con el "rumor" de que el estimador obtenido a partir de la probabilidad de perfil está sesgado (edición: incluso asintóticamente)?
2 votos
Sólo una nota, los estimadores de la probabilidad también pueden estar sesgados, el ejemplo clásico es la estimación de la varianza de la probabilidad para una muestra normal.
0 votos
@mpiktas: Gracias por tu comentario. Efectivamente, el mle clásico también puede estar sesgado. Voy a editar la pregunta para que quede más claro.
0 votos
¿qué es el sesgo asintótico? ¿Está hablando de estimadores no consistentes?
0 votos
@mpiktas: Sí, esto es lo que debería haber dicho...