Sugiero mirarlo de otra manera ...
En la regresión logística predecimos alguna clase binaria {0 o 1} calculando la probabilidad de verosimilitud, que es la salida real de $\text{logit}(p)$ .
Esto, por supuesto, suponiendo que las probabilidades logarítmicas puedan describirse razonablemente mediante una función lineal, por ejemplo, $\beta_0 + \beta_1x_1 + \beta_2x_2+ \dotsm $
... Esta es una gran suposición, y sólo a veces se cumple. Si esos $x_i$ no tienen una influencia independiente y proporcional en las probabilidades logarítmicas, entonces es mejor elegir otro marco estadístico. Es decir, el log-odds se compone de algún componente fijo $\beta_0$ y se incrementa progresivamente con cada trimestre sucesivo, $\beta_i x_i$ .
En resumen $\beta_0$ es el "componente fijo" de ese método por componentes para describir las probabilidades logarítmicas de cualquier evento/condición que esté intentando predecir. Recuerde también que, en última instancia, una regresión describe una media condicional, dado un conjunto de $x_i$ valores. Ninguna de esas cosas requiere que $x_i$ -valores sean 0 en sus datos o incluso posibles en la realidad. La dirección $\beta_0$ simplemente desplaza esa expresión lineal hacia arriba o hacia abajo para que los componentes variables sean más precisos.
Tal vez dije lo mismo con una mentalidad ligeramente diferente, pero espero que esto ayude ...