Tienes razón, esa es la forma abstracta derivadas parciales se definen en la Topología Diferencial. Nota, sin embargo, que sólo ha escrito las partes principales de ellos. La definición completa es
$$
E_1F(a,v,b)=(F(a,b),D_aF(-,b)v),
$$
y lo mismo para $E_2$. Ambos mapas son de fibra de mapas de más de $F:A\times B\to C$. La notación habitual es, sin embargo, más clásica, decir $E_i=D_i$, incluso
$$
D_aF(-,b)v=\frac{\partial F}{\partial x}(a,b)v,\quad D_bF(a,-)w=\frac{\partial F}{\partial y}(a,b)w.
$$
Por supuesto,
$$
DF(a,b)(v,w)=\frac{\partial F}{\partial x}(a,b)v+\frac{\partial F}{\partial y}(a,b)w
$$
Son diferenciables y las asignaciones de $E_1E_2=E_2=E_1$ (salvo, quizás, el reordenamiento de los componentes). Y sí, los cálculos son sucios. La mejor manera de proceder es la localización, ya que claramente el asunto es local en $A, B, C$. Por lo tanto, uno puede suponer que estos tres colectores están abiertas pone en ${\mathbb R}^m, {\mathbb R}^n, {\mathbb R}^p$. Luego, después de un poco de trabajo, uno se
$$
E_2E_1F(a,v,b,w)=\big(F(a,b),\frac{\partial F}{\partial x}(a,b)v,\frac{\partial F}{\partial y}(a,b)w, \frac{\partial^2 F}{\partial y\partial x}(a,b)(v,w)\big).
$$
Si calculamos el $E_1E_2$ la diferencia podría ser el cuarto término, pero tenemos la Schwarz regla (para la clase 2 mapas, de lo contrario hay contraejemplos ya en $A\times B=\mathbb R^2$). Este cuarto término es una especie de Hesse. Calcula explícitamente para $F=(F_1,\dots,F_p)$ (como estamos suponiendo $C$ está en el conjunto abierto en ${\mathbb R}^p$) se obtiene el mismo expresiones algebraicas con las sumas
$$
\sum_{k,\ell}\frac{\partial^2 F_j}{\partial y_\ell\partial x_k}(a,b)w_\ell v_k
$$
para$E_2E_1$, y las sumas
$$
\sum_{k,\ell}\frac{\partial^2 F_j}{\partial x\ell\partial y_k}(a,b)v_\ell w_k
$$
para $E_1E_2$, que coinciden por el Schwarz regla.