Supongamos que tenemos un complejo espacio vectorial $V$.
Una norma es una función de $f : V \rightarrow \mathbb{R}$ que satisface
(i) $f(x) \ge 0$ todos los $x \in V$ (Positividad de No Negatividad)
(ii) $f(x + y) \le f(x) + f(y)$ todos los $x, y \in V$ (Subadditivity - Desigualdad de Triángulo)
(iii) $f(\lambda x) = |\lambda|f(x)$ todos los $\lambda \in \mathbb{C}$ $x \in V$ (Positiva Homogeneidad)
(iv) $f(x) = 0$ si y sólo si $x = 0$ (Definición)
A partir de estas propiedades, podemos definir el $l_p-norm$
$$ ||x||_p = \left(\sum \limits_{i=1}^{n}|x_i|^p \right)^\frac{1}{p}$$
Mis preguntas se refieren a ¿por qué estas cuatro propiedades fueron elegidos para esta definición:
(1) Si la norma es sólo una medida, ¿por qué necesitamos todas estas cuatro propiedades?
(2) ¿estas propiedades permiten una buena interpretación geométrica de las normas?
(3) Fueron estas propiedades elegido a bien permitir la anidación de las diferentes normas? Por ejemplo
$$ ||x||_\infty \le ||x||_2 \le ||x||_1$$
(4) Fueron estas propiedades elegido para satisfacer a los pares de las desigualdades? Por ejemplo $$ ||x||_1 \le n||x||_\infty$$
(5) Fueron estas propiedades elegido porque se prestan en otras variantes? Por ejemplo, en $l_2$ bi-secuencias infinitas, el vector de valores de las secuencias o general de las secuencias.
(6) ¿estas propiedades permiten una extensión en otros espacios de funciones donde todos los elementos anteriores todavía? Por ejemplo, $L_2$ o $L_p$ espacios de funciones.
No he mirado las normas en bastante tiempo, así que por favor me perdone si me estoy perdiendo algo muy obvio.