Dejemos que $S$ sea una cadena de longitud $n$ . Cada carácter de $S$ tiene probabilidad $p$ de ser "A" y la probabilidad $1-p=q$ de ser "B". $R$ es el número de apariciones de la subcadena "AB" en $S$ . Me gustaría determinar $\mathbf{E}[R]$ y $\mathbf{var}[R]$ . Puedo determinar la expectativa mediante una definición recursiva y la expectativa total:
$\mathbf{E}[R] = pq\left(1+\mathbf{E}\left[R_{n-1}\right]\right)+\left(1-pq\right)\mathbf{E}\left[R_{n-1}\right]$
Pero no estoy seguro de cómo puedo enfocar el problema para determinar la varianza.
He intentado definir una Función de Masa Probable pero parece que se va a complicar muy pronto. $\Pr(R=x) = \binom{n-x}{x}\cdot\left(pq\right)^{x} \cdot \text{probability of no other ABs}$
Y esa probabilidad "no otra" acaba siendo, por ejemplo para $x=1$ :
$\sum_{i=0}^{u}p^i q^{u-1} \cdot \sum_{i=0}^{v}p^i q^{u-1}$ sumando todos los $u+v+2=n$ pero creo que puede haber una forma mejor.