Estoy tropezando con algo elemental (creo).
Dado un mapa suave $f\colon M\to N$ entre variedades suaves, el diferencial de $f$ en $p\in M$ se define como \begin{align}\mathrm{d}_pf \colon T_pM &\to T_{f(p)}N\\ X&\mapsto X(-\circ f)\end{align} El gradiente de $f\colon M\to \mathbb{R}$ en $p$ es, si entiendo bien, sólo la definición anterior con $T_{f(p)}\mathbb{R}\cong\mathbb{R}$ . Pero aquí es donde me confundo, porque inmediatamente después del gradiente de $f$ se define por $$\mathrm{d}_pf(X):=X(f), \qquad \text{ with }X\in T_pM.$$ Entiendo esto, ya que $\mathrm{d}_pf\colon T_pM\to\mathbb{R}$ (linealmente) es un covector y el lado derecho funciona, pero ¿cómo puedo ver esto como un caso especial de lo anterior? (es decir, ¿por qué el $``\, -\ \circ\,''$ se deja caer).
¿Y cómo los elementos de $T_{f(p)}\mathbb{R}$ actúan sobre funciones reales? (quizás esto es más bien lo que estoy buscando).