No hay mucho que decir sobre el tema, pero al menos el punto de vista técnico (en mi opinión) es la siguiente:
Consideremos, en primer lugar la situación en $\mathbb{R}^n$. Deje $X,Y \colon \mathbb{R}^n \rightarrow \mathbb{R}^n$ campos vectoriales. Para definir la derivada direccional del campo de vectores $X$ en la dirección del vector de campo $Y$ a un punto de $p \in \mathbb{R}^n$, podemos imitar usual de la definición de derivada direccional:
$$ (\nabla_Y X)(p) := \lim_{t \to 0} \frac{X(p + tY(p)) - X(p)}{t}. $$
El resultado $(\nabla_Y X)$ es un campo de vectores en $\mathbb{R}^n$. Se puede comprobar que la operación $\nabla$ se define como el anterior satisface las siguientes dos propiedades:
- $\nabla_{fY}(X) = f\nabla_Y X$.
- $\nabla_Y(fX) = (Yf)X + f\nabla_YX$.
Aquí, $X,Y \colon \mathbb{R}^n \rightarrow \mathbb{R}^n$ son campos vectoriales y $f \colon \mathbb{R}^n \rightarrow \mathbb{R}$ es una función escalar. La función de $Yf$ (a un punto de $p$) es la derivada direccional de $f$ $p$ en la dirección $Y(p)$.
Ahora vamos a intentar imitar el de arriba a la construcción de un colector general. Dado campos vectoriales $X,Y \in \mathfrak{X}(M)$, tratamos de utilizar la misma fórmula y definir
$$ (\nabla_Y X)(p) := \lim_{t \to 0} \frac{X(p + tY(p)) - X(p)}{t}. $$
Sin embargo, vemos que hay dos problemas. En primer lugar, la expresión $X(p + tY(p))$ no está definido, porque no tenemos forma de añadir un punto de $p \in M$ a un vector tangente $tY(p) \in T_pM$. Esto no es tan malo, porque en realidad podemos sustituir la expresión $p + tY(p)$ con cualquier curva ", que va en la dirección $Y(p)$", tales como el flujo de $\varphi_t^Y(p)$. El problema más grave es que tenemos que restar el vector tangente $X(p) \in T_pM$ desde el vector tangente $X(\varphi_t^Y(p)) \in T_{\varphi_t^Y(p)}$ y estos son dos vectores de tangentes que pertenecen a los diferentes espacios vectoriales. En general, sin datos adicionales, no tenemos ninguna manera de identificar tangente espacios en diferentes puntos de $M$.
En resumen, vemos que podemos diferenciar campos vectoriales a lo largo de campos vectoriales sin ningún problema en $\mathbb{R}^n$ pero también podemos encontrar problemas cuando tratamos de hacerlo en un colector general. Pero $\mathbb{R}^n$ es también un colector ¿qué lo hace tan especial? El hecho de que no es sólo un colector, sino un espacio vectorial y un espacio afín y por lo que podemos añadir puntos a los vectores y a identificar tangente espacios en diferentes puntos de las traducciones. Esto es algo que no tenemos en un colector general.
La definición de una conexión afín está destinado a suministrar el colector $M$ "externamente" con una operación $\nabla \colon \mathfrak{X}(M) \times \mathfrak{X}(M) \rightarrow \mathfrak{X}(M)$ que satisface las propiedades de $(1)-(2)$, por lo que nos permite diferenciar campos vectoriales a lo largo de campos vectoriales. Es decir, en lugar de la definición de la derivada direccional de un campo vectorial a lo largo de un campo de vectores, necesitamos que alguien nos maneja un mecanismo de $\nabla$ que satisface las propiedades de que el familiar derivado satisfecho en $\mathbb{R}^n$ y, a continuación, vamos a pensar en ello como una derivada direccional.
Obviamente, esto plantea un buen montón de preguntas. ¿Ese mecanismo existe siempre? (Sí). Es lo único? (No). Hay una selección natural de tal diferenciación mecanismo? (Sí, bajo ciertas circunstancias). Podemos usar este mecanismo para recuperar la capacidad de identificar los vectores de tangentes en diferentes puntos que era necesario definir los regulares de la derivada direccional en $\mathbb{R}^n$? (Sí, al menos a lo largo de las curvas. Esto conduce a la noción de transporte paralelo). Me refiero a que el extenso artículo sobre la derivada covariante (que es casi otro nombre para una conexión afín) en la wikipedia para más detalles.