¿Por qué definimos la derivada parcial evaluada en $p$ de esta manera extraña?
Sea $V\subseteq\mathbb R^n$ un conjunto abierto y $f:V\rightarrow \mathbb R$ una función de valor real en $V$. Entonces para cada $i=1,2,\dots,n$ la derivada parcial (si existe) se define como $$ (D_if)(r^1,\dots,r^n):=\lim_{h\rightarrow 0}\frac{f(r^1,\dots,r^i+h,\dots,r^n)-f(r^1,\dots,r^i,\dots,r^n)}{h}. $$En particular, esto esencialmente requiere que la función esté definida en algún conjunto abierto de $\mathbb R^n$.
Sea $f\in C^\infty_p(M)$ una función suave germinal cerca de $p\in M$ de la variedad de $n$ dimensiones $M$. Esto quiere decir que $f$ está representado por una función suave definida cerca de $p$ y dos funciones suaves definidas cerca de $p$ representan el mismo germen $f$ si y solo si coinciden en algún vecindario de $p$.
No podemos definir la derivada parcial de $f$ (o cualquier representante) directamente, porque $M$ no es un conjunto abierto de $\mathbb R^n$. Sin embargo, supongamos que $(U,x)$ es un sistema de coordenadas local cerca de $p$. Entonces $x:U\rightarrow V\subseteq\mathbb R^n$ es un homeomorfismo entre $U\subseteq M$ y $V\subseteq \mathbb R^n$. Podemos suponer sin pérdida de generalidad que el germen $f$ tiene un representante definido en $U$ y también escribimos $f$ para este representante. Entonces la función $$ \hat f:=f\circ x^{-1} $$ es una función suave definida en $V\subseteq\mathbb R^n$, que es un conjunto abierto de $\mathbb R^n$. Explícitamente, tenemos $$ \hat f(x^1(p),\dots,x^n(p))=f(p) $$ para cada $p\in U$. Ahora podemos tomar las derivadas parciales de esta función, por lo que definimos $$ \frac{\partial f}{\partial x^i}(p):=(D_i\hat f)(x(p)). $$ Esto es necesario porque no podemos tomar derivadas parciales en $M$ directamente ya que $f$ no es una función multivariable. Pero los mapas de coordenadas se pueden utilizar para representar $f$ como la función multivariable $\hat f$, que luego es parcialmente diferenciable. De ahí el procedimiento "extraño".
¿Cómo se puede verificar si esto realmente cumple la regla de Leibnitz?
Usando la notación anterior, tenemos para cualquier par de gérmenes $f,g\in C^\infty_p(M)$ (identificados con sus representantes definidos en el dominio de coordenadas $U\subseteq M$) $$ \frac{\partial(fg)}{\partial x^i}(p)=D_i(\widehat{fg})(x(p)) \overset{(1)}{=} D_i(\hat f\hat g)(x(p)) \overset{(2)}{=} (D_i\hat f)(x(p))\hat g(x(p))+\hat f(x(p))(D_i\hat g)(x(p)) \\ =\frac{\partial f}{\partial x^i}(p)g(p)+f(p)\frac{\partial g}{\partial x^i}(p), $$donde en (1) hemos utilizado $$ \widehat{fg}=(fg)\circ x^{-1}=(f\circ x^{-1})(g\circ x^{-1})=\hat f\hat g, $$es decir, que la composición se distribuye respecto a la multiplicación y en (2) hemos utilizado que la derivada parcial ordinaria $D_i$ en $\mathbb R^n$ sigue la regla de Leibniz.