Tenemos dos clases, C0 y C1 , entonces podemos expresar la probabilidad condicional como, P(C0|x)=P(x|C0)P(C0)P(x) aplicando el teorema de Bayes, P(C0|x)=P(x|C0)P(C0)P(x|C0)P(C0)+P(x|C1)P(C1)=11+exp(−logP(x|C0)P(x|C1)−logP(C0)P(C1)) el denominador se expresa como 1+eωx .
¿En qué condiciones se reduce la primera expresión a un término lineal? Si se considera la familia exponencial (una forma canónica para las distribuciones exponenciales como Gauß o Poisson), P(x|Ci)=exp(θix−b(θi)a(ϕ)+c(x,ϕ)) entonces terminas teniendo una forma lineal, logP(x|C0)P(x|C1)=[(θ0−θ1)x−b(θ0)+b(θ1)]/a(ϕ)
Obsérvese que suponemos que ambas distribuciones pertenecen a la misma familia y tienen los mismos parámetros de dispersión. Pero, bajo ese supuesto, la regresión logística puede modelar las probabilidades de toda la familia de distribuciones exponenciales.