En http://cs229.stanford.edu/notes/cs229-notes-all/cs229-notes5.pdf pg 5, se indica que la búsqueda hacia adelante toma $O(p^2)$ (nota que las notas utilizan $n$ en lugar de $p$ para el número de variables independientes).
¿No es en realidad el número de llamadas $O(2^p \cdot k)$? Se consideran todos los posibles subconjuntos de variables independientes en la búsqueda hacia adelante, de los cuales hay $2^p$. Para cada subconjunto se realiza una validación k-fold, por lo que $k$ llamadas de aprendizaje para cada subconjunto.
¿Cómo es que es cuadrático en lugar de exponencial?