Para empezar, puedes escribir la definición de una norma p y luego intentar calcular la derivada parcial. $\| \boldsymbol{\mathrm{x}}\|_p = (|x_1|^p + |x_2|^p + \dots + |x_n|^p)^{\frac{1}{p}}$
Para calcular una derivada parcial con respecto a una variable, se supone que el resto de las variables son constantes y entonces se calcula una derivada real con respecto a la única variable en consideración.
$$\frac{\partial \| \boldsymbol{\mathrm{x}}\|_p }{\partial x_i}= (|x_1|^p + |x_2|^p + \dots + |x_n|^p)^ {1/p-1}*|x_i|^{p-1} * sign(x_i)$$ (Hay que comprobar las matemáticas aquí para asegurarse de que no hay errores tipográficos)
Puedes simplificar y combinar tus parciales para obtener una matriz \vector para la matriz del gradiente \vector.
Cuando hay funciones dentro de la norma, se puede utilizar la regla de la cadena matricial para el resto del cálculo. Matrixcookbook podría ser útil aquí.
Nótese que algunas normas no son diferenciables en todos los puntos. Por ejemplo, la norma L1 no es diferenciable en el vector cero.
*Typo en la derivada es fijo