Estoy tratando de conseguir una manija en el concepto de la sobredispersión en la regresión logística. He leído que la sobredispersión es cuando se observa la varianza de una variable de respuesta es mayor de lo que cabría esperar a partir de la distribución binomial.
Pero si un binomio variable sólo puede tomar dos valores (1/0), ¿cómo puede tener una media y la varianza?
Estoy bien con el cálculo de la media y la varianza de los éxitos de x número de ensayos de Bernoulli. Pero no puedo envolver mi cabeza alrededor del concepto de la media y la varianza de una variable que sólo puede tomar dos valores.
¿Alguien puede proporcionar una interfaz intuitiva reseña de:
- El concepto de la media y la varianza de una variable que sólo puede tomar dos valores
- El concepto de sobredispersión en una variable que sólo puede tomar dos valores