Supondré que $i=n$ si $X_0$ no es mayor que ninguno de los $X_k.$ Entonces $$ \mathrm E(i) = \mathrm P(i \geq 1) + \mathrm P(i \geq 2) + \cdots + \mathrm P(i \geq n). $$
Obviamente $\mathrm P(i \geq 1)=1$ pero $i \geq 2$ sólo si $X_0$ es el mayor de los valores $X_0,X_1$ Cualquiera de los dos es igualmente probable que sea mayor, así que $\mathrm P(i \geq 2)=\frac12.$ De la misma manera, $i \geq 3$ sólo si $X_0$ es el mayor de los tres valores $X_0,X_1,X_2$ Cualquiera de ellos tiene la misma probabilidad de ser el mejor de la lista, así que $\mathrm P(i \geq 3)=\frac13.$ En general, para $k \leq n,$ $i \geq k$ sólo si $X_0$ es el mayor de los $k$ valores $X_0,X_1,\ldots,X_k$ Cualquiera de ellos tiene la misma probabilidad de ser el mejor de la lista, así que $\mathrm P(i \geq k)=\frac1k.$
En resumen, $\mathrm E(i) = 1 + \frac12 + \frac13 + \ldots + \frac1n.$ Ahora dejemos que $n \to \infty.$
Apéndice
Para demostrar que $\mathrm E(i) = \mathrm P(i \geq 1) + \mathrm P(i \geq 2) + \cdots + \mathrm P(i \geq n),$ un posible enfoque es observar que $$ \mathrm P(i \geq k) = \mathrm P(i = 1) + \mathrm P(i = 2) + \cdots + \mathrm P(i = k), $$ descomponer todos los términos de la suma de esta manera, y recombinarlos para obtener $$\mathrm P(i = 1) + 2\mathrm P(i = 2) + \cdots + n\mathrm P(i = n).$$
Otra forma es definir $Z_k = 1$ si $i \geq k,$ $Z_k = 0$ de lo contrario, es decir, $Z_k$ es una variable indicadora que dice si comparamos $X_0$ a $X_k$ (en lugar de parar antes). Pero como $i$ es sólo el número de comparaciones que hicimos, $i = Z_1 + Z_2 + \cdots + Z_n$ (añadiendo $1$ para cada $X_k$ que realmente se comparó y $0$ para cada uno de los otros), y por la linealidad de la expectativa, $$\mathrm E(i) = \mathrm E(Z_1) + \mathrm E(Z_2) + \cdots + \mathrm E(Z_n).$$
Pero $Z_k = 1$ si y sólo si $i \geq k,$ así que $\mathrm E(Z_k) = \mathrm P(i \geq k),$ y la conclusión es inmediata.