Mi pregunta es: ¿Cuál es la relación matemática entre el Distribución Beta y los coeficientes del modelo de regresión logística ?
Para ilustrar: la función logística (sigmoide) viene dada por
$$f(x) = \frac{1}{1+\exp(-x)}$$
y se utiliza para modelar las probabilidades en el modelo de regresión logística. Sea $A$ ser un dicotómico $(0,1)$ resultado puntuado y $X$ una matriz de diseño. El modelo de regresión logística viene dado por
$$P(A=1|X) = f(X \beta).$$
Nota $X$ tiene una primera columna de constante $1$ (intercepción) y $\beta$ es un vector columna de coeficientes de regresión. Por ejemplo, cuando tenemos un regresor (estándar-normal) $x$ y elija $\beta_0=1$ (intercepción) y $\beta_1=1$ podemos simular la "distribución de probabilidades" resultante.
Este gráfico recuerda a la distribución Beta (al igual que los gráficos para otras opciones de $\beta$ ) cuya densidad viene dada por
$$g(y;p,q) = \frac{\Gamma(p)\Gamma(q)}{\Gamma(p+q)} y^{(p-1)} (1-y)^{(q-1)}.$$
Utilizando máxima verosimilitud o métodos de momentos es posible estimar $p$ y $q$ de la distribución de $P(A=1|X)$ . Por lo tanto, mi pregunta se reduce a: ¿cuál es la relación entre las opciones de $\beta$ y $p$ y $q$ ? Esto, para empezar, aborda el caso bivariante dado anteriormente.