17 votos

Intuición detrás de la dependencia funcional

¿Cuál es la intuición detrás de la independencia funcional?

(Esto se define de la siguiente manera: Sea $k\leq n$. Las funciones $C^1$ $F_1,\ldots,F_k:\mathbb{R}^n\rightarrow \mathbb{R}$ son funcionalmente independientes si la matriz cuyas columnas son los gradientes $\nabla F_1,\ldots,\nabla F_k$ tiene rango completo, es decir, rango $k$, en todo el dominio de definición.

Por lo que entiendo de esta respuesta, esto es lo mismo que decir que $F:=(F_1,\ldots,F_k):\mathbb{R}^n\rightarrow \mathbb{R}^k$ es sumersión, pero eso tampoco me ayuda mucho, porque tampoco tengo ninguna intuición sobre sumersiones.)

Entonces, ¿qué significa realmente si las funciones son funcionalmente independientes - o, por el contrario, dependientes? ¿Existe, en el último caso, alguna relación como $g(\nabla F_1,\ldots,\nabla F_k)=0$ -- o tal vez como $g(F_1(x),\ldots F_k (x))=0$ para algún $x$ -- para que $g$ esté en cierto conjunto específico, similar al caso de independencia lineal (en el cual $g$ sería del conjunto $\{g:\mathbb{R}^k\rightarrow \mathbb{R}:g(x_1,\ldots,x_k)=\sum \lambda_i x_i \text{ para algunos } \lambda_i \neq 0 \in \mathbb{R}\}$).

0 votos

¿Qué pasa si los gradientes no existen? Es implícito en tu suposición, ¿por qué no mencionarlo desde el principio, por ejemplo $C^1$ o similar?

0 votos

@alancalvitti si los gradientes no existen, no podemos hablar de dependencia funcional. Pero para mayor completitud, agregué la suposición $C^1$ en el post.

0 votos

La dependencia funcional significa que existe una relación total a la izquierda y unívoca. La estructura diferencial no forma parte de la definición.

13voto

CodingBytes Puntos 102

Dependencia funcional de $k$ funciones dadas $F_i:\>\Omega\to{\mathbb R}$ $\>(1\leq i\leq k)$ con dominio común $\Omega\subset{\mathbb R}^n$ significa, intuitivamente, que existe una función no trivial $$g:\quad{\mathbb R}^k\to{\mathbb R},\qquad y\mapsto g(y)$$ tal que $$g\bigl(F_1(x),F_2(x),\ldots, F_k(x)\bigr)\equiv 0\qquad \forall x\in\Omega\ .\tag{1}$$ "No trivial" para $g$ significa que $\nabla g(y)\ne0$ para todo $y\in{\mathbb R}^k$. Derivando $(1)$ vemos que $$dg\bigl(F(x)\bigr)\cdot dF(x)\equiv 0\in{\cal L}({\mathbb R}^n,{\mathbb R}^k)\qquad\forall x\in\Omega\ .$$ En términos de matrices esto dice que las filas de la matriz $\bigl[dF(x)\bigr]$ son linealmente dependientes con coeficientes dados por $\nabla g\bigl(F(x)\bigr)\ne0$, para cada $x\in\Omega$.

Ahora las filas de la matriz $\bigl[dF(x)\bigr]$ no son más que los gradientes $\nabla F_i(x)$. Por lo tanto, la dependencia funcional de los $F_i$ en el sentido anterior implica que los gradientes $\nabla F_i(x)$ son linealmente dependientes, en cada punto $x\in\Omega.

En tu definición de "independencia funcional" no quieres ni una pista de tal cosa. Por lo tanto, insistes en que en todos los puntos $x\in\Omega$ los $k$ gradientes $\nabla F_i(x)$ deberían ser linealmente independientes.

0 votos

Entonces, la independencia funcional de $k$ funciones debería significar en realidad la negación de tu definición, es decir, ¿que existe un $x_0\in \Omega$ tal que los $k$ gradientes son independientes?

0 votos

@user36772: De hecho, hay una brecha entre la idea de dependencia funcional y tu definición de independencia funcional.

0 votos

¿Podrías darme una referencia donde se pueda encontrar una definición de (in)dependencia funcional, para que tenga algo oficial para citar, al referirme a la definición?

2voto

paoloff Puntos 176

La independencia funcional entre dos funciones significa que el conjunto de nivel de cada una de las funciones se intersecta transversalmente con el conjunto de nivel de la otra función. En el plano, esto significa que una función $f$ funcionalmente independiente de otra función $g$ no puede ser escrita como $f=F(g)$ donde $F$ es otra función, porque en este caso, los conjuntos de nivel serían las mismas curvas, tanto para $f$ como para $g$. De manera similar, en $k$ dimensiones, la independencia funcional significa que la intersección entre los conjuntos de nivel de $k$ dimensiones $(k-1)$ de las $k$ funciones es un punto, no una línea o un plano, es decir, las funciones $F_1$, $F_2$,...,$F_k$ contienen $k$ informaciones independientes de su espacio ambiente, y pueden ser tomadas localmente como coordenadas.

1voto

Spencer Puntos 48

La derivada de $F$ es $DF=[\nabla F_1,\cdots,\nabla F_k]^T$ ; sea $a\in\mathbb{R}^n$, $b=F(a)$ y $V=F^{-1}(b)$. $V$ es la intersección de los $k$ hipersuperficies $F_i(x)=b_i$. El vector normal en $a$ a tal hipersuperficie es $\nabla F_i(a)\in \mathbb{R}^n$. Aquí $rank(DF_a)=k$, es decir $W=span(\nabla F_1(a),\cdots,\nabla F_k(a))$ tiene dimensión $k$. Según el teorema de la función implícita, en una vecindad de $a$, $V$ es una variedad de dimensión $n-k$, es decir, $V$ es $C^1$-isomorfo a un subconjunto abierto de $\mathbb{R}^{n-k}$. Además, el espacio tangente de $V$ en $a$ es el ortogonal de $W.

Por ejemplo, sea $n=3, k=2$. $V$ es la intersección de $2$ superficies en el espacio estándar. Los vectores normales $u_1,u_2$ en $a$ no son paralelos; entonces $V$ es localmente una línea y el producto cruzado $u_1\times u_2$ es tangente a esta línea.

EDIT 1. En otras palabras, una aproximación de la ecuación de $V$ es $DF_a(x-a)=0$, es decir, para todo $i\leq k$, $<\nabla F_i(a),x-a>=0$.

@ user36772 , Acabo de leer tus últimas cuatro líneas! Hablas sobre el caso en que (en mi ejemplo) los $2$ normales anteriores son paralelos. Entonces las superficies son tangentes en $a$ y no sabemos nada sobre la intersección. En otras palabras, cuando las hipótesis de un teorema no se cumplen, entonces (¿es sorprendente?) el teorema no funciona.

EDIT 2. (respuesta a user36772). Un conjunto de nivel es una subvariedad de codimensión $1$, es decir, una hipersuperficie.

El espacio tangente a una hipersuperficie es el hiperplano que es ortogonal a un vector normal; entonces el espacio tangente a $V$ es la intersección de estos hiperplanos. Desde el punto de vista geométrico, decir que las funciones $C^1$ son independientes en una vecindad de $a$ es equivalente a identificar cada hipersuperficie con su hiperplano tangente en $a$ y decir que las ecuaciones lineales asociadas a estos hiperplanos son linealmente independientes. Esta propiedad es estable en el siguiente sentido: si movemos ligeramente nuestras hipersuperficies, entonces la intersección permanece similar a la original.

Si estas ecuaciones no son linealmente independientes, entonces la inestabilidad viene a galope. Por ejemplo, considera, en $\mathbb{R}^3$, $a=0, F_1=y-x^2,F_2=y-x^4$. Luego, localmente, la intersección de las superficies es la línea $Oz$. Sin embargo, si mueves una superficie, entonces la intersección puede ser localmente vacía.

Considera también el GPS; necesitamos $5$ satélites. Geométricamente, la intersección de $3$ esferas es suficiente. Sin embargo, una cuarta medida permite la sincronización de los relojes. ¿Por qué la quinta? Porque si dos de los satélites están "cerca", entonces las esferas asociadas son casi tangentes y la intersección es inestable.

0 votos

Creo que querías decir que $V$ es la intersección de $k$ conjuntos de nivel, no hiperplanos. Vale, creo que entendí la interpretación geométrica local de la independencia funcional: En cada punto, la preimagen es una variedad de dimensión $n-k$. Pero lo que eso significa geométricamente globalmente o algebraicamente para las funciones $F_1,...,F_k$ todavía no me queda claro: como la independencia lineal significaría geométricamente globalmente que los vectores se encuentran en el mismo plano y algebraicamente significa que cada combinación lineal, donde al menos algunos escalares son distintos de cero, también es distinta de cero.

0 votos

Específicamente en tu respuesta, si los vectores normales son paralelos, ¿podrías explicar un poco más formalmente por qué las superficies tienen que estar tangentes? ¿Y qué teorema mencionas que no funciona?

0 votos

La independencia lineal no está definida para ecuaciones sino para vectores, así que no estoy seguro de lo que exactamente quieres decir, cuando dices "las ecuaciones lineales asociadas a estos hiperplanos son linealmente independientes". Supongo que querías decir que los hiperplanos están generados por un número finito de vectores - pero luego también no está claro para mí cómo interpretar la independencia lineal en este caso porque la independencia lineal no está definida para múltiples familias/ conjuntos de vectores (cada uno abarcando en un hiperplano), sino solo para una familia/ conjunto de vectores. [...]

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X