Esta es una pregunta justa, ya que va en contra de la intuición de la forma en que se enseña el cálculo introductorio.
Uno mira una función lineal típica en cálculo 1: $f(x)=ax$, $a\neq0$, toma la derivada, $f'(x)=a$, y piensa para sí mismos, "¡bueno claramente la función lineal no es igual a la función constante, una tiene pendiente y la otra es plana!"
Dado que generalizamos a dimensiones más altas, es más sabio prestar más atención a lo que llamamos la derivada. Simplemente mirar el Jacobiano enmascara una comprensión más profunda: la derivada es la mejor aproximación afín a una función en un punto particular. Es decir, $F(x)\approx F(a) + F'(x-a)+o(|x-a|)$, que es una buena aproximación cuando $x$ está cerca de $a. Observa que $F'$ actúa como un "factor" en el vector tangente $(x-a)$.
¿Qué pasa si $F$ ya es afín? Entonces $F(x)=Ax+b$. Enchúfalo en la fórmula de arriba, que ahora tiene una igualdad exacta, y obtienes: $Ax+b=Aa+b+F'(x-a)$, lo que da $A(x-a)=F'(x-a)$, o si llamamos $h=x-a$, $Ah=F'h$. Observa lo que te está diciendo: $A$ y $F'$ hacen lo mismo con los vectores $h$, por lo tanto son iguales. $A$ también es la derivada de $F(x)$.
Cuando $F$ es lineal, $b=0$, y por lo tanto $Fh=Ah=F'h. Tiene sentido.
¿Qué pasa con nuestro ejemplo de cálculo 1? La confusión proviene de la nomenclatura. La transformación lineal no es $ax$, sino $a$. Velo como $fx=ax$. Es una matriz 1x1 con la entrada $a$. La derivada (Jacobian), en cualquier punto , también es simplemente $a$. Por lo tanto, $f'x=ax$ también. Por lo tanto, la noción generalizada de derivada ya no es "la función de la pendiente", sino una transformación lineal única que lleva vectores tangentes a vectores tangentes que mejor aproxima el comportamiento lineal de una función en un punto particular. Desde ese punto de vista tiene sentido que $fx=ax=f’x$ ya que estamos viendo $f$ y $f'$ como "factores" en puntos particulares en lugar de funciones cambiantes. Por eso se utiliza $Df(x)$ (que es simplemente $a$ en nuestro ejemplo) como notación para la derivada en un punto particular $x$ en lugar de $f'$.
Si estás interesado, hay nociones de derivadas superiores que toman la derivada de la asignación que a cada punto $x$ le asigna la matriz $Df(x)$, que difiere de tomar la derivada de la misma matriz $Df(x)$, que es simplemente lineal y por lo tanto la misma. Ver: http://www.math.pitt.edu/~sph/1540/1540-notes4.pdf