Estoy aprendiendo regresión logística y me he confundido al ver la ecuación del libro de texto. Yo sabía que para una distribución continua, para calcular la probabilidad, el pdf $f(x)$ no tiene sentido. En su lugar, la función de densidad acumulativa $F(x)$ se utilizará. Así, puesto que estamos maximizando la probabilidad, ¿no deberíamos utilizar el producto de cdf s en lugar de pdf s en el lado derecho de la ecuación MLE? Gracias.
ACTUALIZACIÓN, y más preguntas:
Esta pregunta plantea una cuestión interesante sobre por qué no solemos utilizar el hecho de que $Y=F(X)\sim U(0,1)$ y luego intentar minimizar la divergencia KL entre $Y$ y $U$ :
$$\text{KL}(Y, U) = \int_0^1 f_y(y) \ln f_y(y) \text{d}y$$
Normalmente tenemos fácil acceso a la forma de $f$ (el pdf original) pero $F$ podría ser menos manejable y $f_Y$ es básicamente algo que tendríamos que estimar utilizando FCD empíricas basadas en las muestras $F(X_i), i=...$ . La pregunta es, ¿son muy diferentes los resultados de las dos formulaciones (la MLE habitual y la versión KL anterior)?