Siempre me ha disgustado la definición de diferenciable que se da en los textos de introducción al cálculo multivariable. Wikipedia tiene una definición mucho más agradable que trataré de detallar.
La derivada no se visualiza tan fácilmente en dimensiones superiores. Sin embargo, la idea es la misma. La recta tangente en un punto $x$ es la línea que mejor se aproxima a la función en $x$ . Esta idea de aproximación lineal (o, en realidad, afín) se traslada a dimensiones superiores.
Estás familiarizado con la definición habitual de una derivada de una variable: $f'(x) = \lim_{h \to 0} \frac{f(x + h) - f(x)}{h}$ . Puede que al principio no esté claro cómo generalizar esto a las funciones multivariables, pero esperamos que lo esté después de reordenar la ecuación anterior: $$ f'(x) = \lim_{h \to 0} \frac{f(x + h) - f(x)}{h} \iff 0 = \lim_{h \to 0} \frac{f(x + h) - f(x) - f'(x)h}{h} \, . $$ Tenga en cuenta que para un $x$ la función $L(h) = f'(x) h$ es sólo una línea que pasa por el origen con pendiente $f'(x)$ que es un ejemplo de mapa lineal en el sentido del álgebra lineal. En general, la derivada de una función $f : \mathbb{R}^m \to \mathbb{R}^n$ en un punto ${x} \in \mathbb{R}^m$ se define como un mapa lineal $Df_{x} : \mathbb{R}^m \to \mathbb{R}^n$ tal que $$ \lim_{h \to 0} \frac{f(x + h) - f(x) - Df_x(h)}{\|h\|} = 0 $$ donde $\|h\|$ es la longitud del vector $h \in \mathbb{R}^m$ . Se puede demostrar que dicho mapa lineal es único si existe. También se puede demostrar que este mapa lineal $Df_x$ puede representarse como una multiplicación por la izquierda del Matriz jacobiana $$ [Df_x] = \begin{pmatrix} \left. \frac{\partial F_1}{\partial x_1} \right|_x & \cdots & \left. \frac{\partial F_1}{\partial x_m} \right|_x\\ \vdots & & \vdots\\ \left. \frac{\partial F_n}{\partial x_1} \right|_x & \cdots & \left. \frac{\partial F_n}{\partial x_m} \right|_x \end{pmatrix} $$ donde el $F_i : \mathbb{R}^m \to \mathbb{R}$ son las funciones componentes de $F$ es decir, $F(x) = (F_1(x), \ldots, F_n(x))$ .
Bien, después de todas esas definiciones abstractas, consideremos tu ejemplo particular. Para una función $f : \mathbb{R}^2 \to \mathbb{R}$ la derivada puede ser visualizada como el plano tangente a la gráfica de $f$ . Escribir $z = f(x,y)$ o $0 = f(x,y) - z$ , entonces los puntos de la gráfica de $f$ son de la forma $(x,y,z) = (x,y,f(x,y))$ . En este caso, $Df_{(x,y)}$ es simplemente el gradiente $\nabla f|_{(x,y)} = \left(\left.\frac{\partial f}{\partial x}\right|_{(x,y)}, \left.\frac{\partial f}{\partial y}\right|_{(x,y)}\right)$ . Dejar $g(x,y,z) = f(x,y) - z$ entonces $\nabla g = ([Df_{(x,y)}],-1) = \left(\left.\frac{\partial f}{\partial x}\right|_{(x,y)}, \left.\frac{\partial f}{\partial y}\right|_{(x,y)}, -1\right)$ . Esto define un vector que es ortogonal al gráfico de $f$ y es el vector normal al plano tangente en el punto $(x,y)$ . Así, a partir de esta definición tan abstracta de derivada dada anteriormente, recuperamos la idea intuitiva de que el plano tangente debe representar la derivada.
Por ejemplo, supongamos que tenemos la función $f(x,y) = x^2 + y^2$ y queremos encontrar su derivada y el plano tangente en el punto $(2,-3)$ . Calculamos el gradiente $\nabla f = (2x, 2y)$ Así que $\left. \nabla f \right|_{(2,-3)} = (4, -6)$ . Tenga en cuenta que $f(2,-3) = 13$ . Dejar $g(x,y,z) = f(x,y) - z$ como en el caso anterior, entonces $\left.\nabla g\right|_{(2,-3,13)} = (4, -6, -1)$ Es el vector normal del plano tangente de la gráfica de $f$ en $(2,-3)$ que calculamos como $$ 4x - 6y - z = (4, -6, -1) \cdot (x,y,z) = (4, -6,-1) \cdot (2, -3,13) = 8 + 18 - 13 = 13 $$ por lo que el plano tangente viene dado por $z = 4x - 6y -13$ .
Para más información, recomiendo Apostol's Análisis matemático .