8 votos

Demostración de la existencia de un vector de probabilidad estrictamente positivo mediante un argumento de separación

Sea $s = (s_1,...,s_n) \in (0,1)^n$ . Supongamos que $x$ es un número real y que $x \in (\min_j s_j, \max_j s_j)$ . No es difícil demostrar, por una construcción directa, que

Existe un vector de probabilidad $p = (p_1,...,p_n) \in (0,1)^n$ tal que $s \cdot p = x$ ,

donde $s \cdot p$ es el producto interior, y $p$ es un vector de probabilidad si $\sum_j p_j = 1$ .

Me pregunto si este resultado puede demostrarse utilizando un argumento de hiperplano de separación. La idea es la siguiente.

Supongamos por contradicción que no existe tal $p \in (0,1)^n$ existe. Entonces, con $X = \{p \in (0,1)^n: p \ \text{a probability vector} \}$ y $Y = \{p: s \cdot p = x\}$ tenemos $X \cap Y = \emptyset$ . Ambos conjuntos $X$ y $Y$ son convexas. Entonces, por el teorema de separación, hay un vector $q \in \mathbb{R}^n$ y $b \in \mathbb{R}$ tal que $q \cdot p \leq b$ para todos $p \in X$ y $q \cdot p \geq b$ para todos $p \in Y$ . Sin embargo, no veo la manera de deducir una contradicción de esto, así que cualquier ayuda aquí sería apreciada.

También me gustaría generalizar este argumento, si se puede hacer que funcione, al caso contablemente infinito, es decir, sustituir $n$ con $\mathbb{N}$ . Cualquier sugerencia sobre cómo lograrlo también sería apreciada.

1voto

antkam Puntos 106

Lema: $q$ y $s$ son paralelas. Geométricamente esto es algo obvio (?) ya que $Y$ es un $(n-1)$ -hiperplano ortogonal a $s$ , en $n$ -por lo que cualquier otro hiperplano situado a un lado de $Y$ deben ser ortogonales a la misma $s$ . La prueba es un poco tediosa y está al final.

Asumiendo el Lemma, entonces WLOG podemos asumir $q=s$ lo que implica $b \le x$ para satisfacer $\forall p \in Y: q \cdot p \ge b$ .

Construir ahora $p$ el vector de probabilidad con $1-\delta$ en el $\max_j s_j$ posición, y ${\delta \over n-1}$ en otros lugares, para algunos pequeños $\delta > 0.$ Este $p \in X$ (es decir $p_j \in (0,1)$ y $\sum_j p_j = 1$ ), y $s \cdot p > (1-\delta) \max_j s_j$ siendo la desigualdad estricta porque todos los demás términos del producto punto son estrictamente positivos ya que ${\delta \over n-1} > 0, s_j > 0$ .

Mientras tanto, $x$ es una constante dada, y $x < \max_j s_j$ implica que podemos elegir $\delta > 0$ s.t. $(1 - \delta) \max_j s_j > x$ . Así, $s \cdot p > (1 - \delta) \max_j s_j > x \ge b$ . Esto contradice la propiedad del hiperplano de separación de $\forall p \in X: s \cdot p \le b$ .

Observaciones: (1) Lo siento esto todavía requiere una construcción. :) (2) Creo que necesitabas definir $X$ no simplemente como $(0,1)^n,$ sino como $X=\{p: p \in (0,1)^n \text{ and } p \text{ is a probability vector}\}$ .

Prueba del lema: Descomponer los hiperplanos $q$ en componentes paralelos y ortogonales, es decir $q = as + t$ de verdad $a$ y algunos $t \perp s$ (es decir $s \cdot t = 0$ ). Por definición de $Y$ para cualquier $c$ tenemos $y = {x \over |s|^2} s + c t \in Y$ desde $s \cdot y = x + 0 = x$ . Mientras tanto, $q \cdot y = ax+c|t|^2$ . Desde $a, x, b$ son todas constantes mientras que $c$ es un número real cualquiera, la única forma de tener $q \cdot y = ax+c|t|^2 \ge b$ siempre, es si $|t|^2=0$ es decir $t=0$ es decir $q = as$ es decir $q \parallel s$ . QED

1voto

Arash Puntos 6587

Proporciono una prueba para el caso general utilizando la propiedad de conectividad y luego comento más sobre el argumento del hiperplano de separación.

La prueba se basa simplemente en el teorema del valor intermedio generalizado utilizando el hecho de que el producto interior es continuo.


Prueba 1:

Considera la función: $$ f(u)={\langle s,u\rangle}, $$ definido en el conjunto $$ \mathcal D=\{u\in(0,1)^{\mathcal U}:\|u\|_1=1\}. $$ Algunos ejemplos de $\mathcal U$ son $\mathbb N$ y $\{1,\dots,n\}$ . Para $\mathcal U=\mathbb N$ , $\mathcal D$ es un subconjunto de $\ell_1$ -es decir, el espacio de todas las secuencias absolutamente convergentes.

Utilizamos la idea del teorema del valor intermedio, es decir, la preservación de la conectividad bajo mapas continuos. Si el conjunto $\mathcal D$ es un subconjunto conexo de un espacio topológico, entonces $f(\mathcal D)$ también es un subconjunto conexo de $\mathbb R$ lo que significa que todo el intervalo $(s_{\inf},s_{\sup})$ está cubierto por elementos de $\mathcal D$ . Por lo tanto, tenemos que demostrar lo siguiente

  • $\mathcal D$ es un subconjunto conexo (de un espacio topológico).
  • $f(u)$ es continua.

Estos se verifican trivialmente por finito $\mathcal U$ .

Consideremos el caso $\mathcal U=\mathbb N$ . $\mathcal D$ es un conjunto convexo y, por tanto, simplemente conexo. $\mathcal D$ es un subconjunto de $\ell_1$ -espacio secuencial. Se trata de un espacio de Banach.

Basta entonces con demostrar la continuidad de $f(u)$ en $\ell_1$ en $\mathcal D$ .

En primer lugar, hay que asegurarse de que el producto interior esté bien definido. Obsérvese que $$ |\langle s,u \rangle-\langle s,v\rangle|\leq \|s\|_2\|u-v\|_2\leq \|u-v\|_1. $$ Por tanto, la función es $1-$ Lipschitz y, por tanto, continua en $\ell_1$ -espacio. Por lo tanto, el resultado es válido para secuencias contablemente infinitas.


Hiperplano de separación:

Consideremos la prueba basada en el hiperplano de separación. El lema proporcionado en la otra respuesta puede adaptarse también al caso general.

Lema. Sea $f$ y $g$ sean dos funciones lineales distintas de cero de un espacio $\mathcal X$ a $\mathbb R$ . Supongamos que para todo $u$ dentro del hiperplano $L$ definido como $f(u)=c_1$ la función $g(u)$ está limitada por arriba (o por abajo) por una constante $b$ es decir, $g(u)\leq b$ (o $g(u)\geq b$ ). Entonces existe una constante $c_2$ tal que para todo $u\in \mathcal X$ $$ g(u)=c_2 f(u). $$

Prueba. Basta con demostrar que $g$ y $f$ tienen el mismo espacio nulo ( ver aquí ).

Para demostrarlo, veremos que $g(u)$ también es constante en el hiperplano $L$ lo que implica $L-u_1$ es el mismo espacio nulo de ambos $f$ y $g$ para un $u_1\in L$ .

Supongamos que $g(u)$ no es constante para $u\in \mathcal R$ tal que $f(u)=c_1$ . Entonces debería haber algún $u_1$ y $u_2$ tal que $f(u_1)=f(u_2)=c_1$ y $g(u_1)\neq g(u_2)$ (de lo contrario $g(u)$ sería constante). Sin pérdida de generalidad, supongamos que $g(u_1)< g(u_2)$ .

Tenga en cuenta que $f(tu_1+(1-t)u_2)=c_1$ para $t\in\mathbb R$ . Tenemos: $$ g(tu_1+(1-t)u_2)=g(u_2)+t(g(u_1)-g(u_2)). $$ Pero esto se puede hacer arbitrariamente pequeño con lo suficientemente grande $t$ violando así la condición. Por lo tanto $g$ debe ser constante en el hiperplano $L$ . $\blacksquare$

Para el siguiente paso, ya que estamos trabajando en infinitas dimensiones $\ell_1$ -espacio, utilizamos Teorema de separación de Hahn-Banach para dos conjuntos $X$ y $Y$ . Ambos conjuntos son convexos y no vacíos.

Problema: El conjunto $X$ no es ni cerrado ni abierto y, por lo tanto, el teorema no se puede aplicar aquí.

Pero si se puede encontrar una función lineal $h$ y $b$ tal que $h(u)<b$ para $u\in X$ y $h(u)\geq b$ para $u\in Y$ el resto de la demostración se deduce en consecuencia. Dado que $Y$ se obtiene mediante $\langle s,u\rangle=x$ el lema anterior implica que $h(u)=c\langle s,u\rangle$ para un número real $c$ que suponemos que es $1$ . Por lo tanto $x\geq b$ y $\langle s,u\rangle<x$ para todos $u\in X$ . Pero esto es erróneo ya que $$ \sup_{\|u\|_1=1}\langle s,u\rangle=s_{\sup}>x. $$

Así que la asignatura pendiente en este momento es sortear este problema. Tenga en cuenta que cambiar $(0,1)^{\mathbb N}$ a $[0,1]^{\mathbb N}$ no funciona aquí porque aunque el conjunto es cerradod no es compacto.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X