3 votos

Intuición sobre las combinaciones lineales de probabilidades condicionadas

Necesito tu ayuda.

Sea $X,Y$ denotan variables aleatorias acotadas de valor real. Supongamos que la probabilidad condicionada $P(X|Y)$ puede escribirse como una combinación lineal de $N=3$ funciones de valor real $f_i(X)$ es decir $P(X|Y) = \sum_{i=1}^N c_i(Y) f_i(X)$ . Los coeficientes $c_i$ y funciones $f_i$ podría ser negativo.

Entonces, ¿puedo encontrar siempre coeficientes exclusivamente no negativos $c'_i$ y funciones no negativas $f'_i$ para que $P(X|Y) = \sum_{i=1}^N c'_i(Y) f'_i(X)$ ?

Para tres $P(X|Y_i)$ Podría abarcar $P(X|Y) = \sum_{i=1}^N c'_i(Y) P(X|Y_i)$ pero, ¿podría elegir esos $P(X|Y_i)$ tal que $c'_i(Y) \ge 0$ ? ¿Quizá si están dentro del casco convexo?

1voto

antkam Puntos 106

Si he entendido bien, la conjetura es falsa para $N=3$ y he aquí un contraejemplo. [Crédito parcial a joriki cuya respuesta borrada (errónea) me llevó por el camino finalmente correcto].

Supongamos que $X$ sólo toma cuatro valores diferentes, y lo mismo para $Y$ . Así que $g_i(x) = P(X = x \mid Y = y_i)$ es sólo un $4$ -vector $\in S = \{(a,b,c,d) \in \mathbb{R}^4: a+b+c+d = 1 \cap a,b,c,d \ge 0\}$ .

Éstos son los cuatro $4$ -vectores para $g_1, g_2, g_3, g_4$ :

$$(\frac12, \frac12, 0, 0),\,\,\,\,\,\, (0, \frac12, \frac12, 0),\,\,\,\,\,\, (0, 0, \frac12, \frac12),\,\,\,\,\,\, (\frac12, 0, 0, \frac12)$$

Dado que los vectores son linealmente dependientes (con tres de ellos cualesquiera actuando como base), esto satisface la condición previa.

Demostrar que la postcondición es imposible es más difícil, y sólo puedo presentar un argumento intuitivo. Cualquier candidato $f'_i$ con tres o cuatro entradas positivas son inútiles - los coeficientes $c'_i$ son no negativos por lo que tal $f'_i$ no puede utilizarse en una combinación lineal positiva (plc) de cualquier $g_i$ que sólo tiene dos entradas positivas. Del mismo modo, cualquier candidato $f'_i$ con dos entradas positivas (y dos ceros) sólo puede utilizarse en un plc de la "concordancia" $g_i$ es decir, uno con las dos mismas entradas positivas. Si eliminamos un $f'_i$ y la "coincidencia" $g_i$ (si lo hay), el problema se reduce a utilizar un $f'_i$ para representar (a través de plc) tal vez uno menos $g_i$ . Después de eliminar todos $f'_i$ con dos entradas positivas (y cualquier $g_i$ ), nos queda $K$ número de $f'_i$ 's, cada uno con una sola entrada positiva, y requiriendo que representen (vía plc) al menos $K+1$ resto $g_i$ 's. Una simple comprobación de $K=0,1,2,3$ demuestra que esto es imposible.

Siento que mi argumento sea tan informal. Me ha costado escribirlo algebraicamente.


Otras observaciones: La razón goemétrica clave de la imposibilidad es que $S$ es un tetraedro que tiene una sección transversal que es un cuadrado, y de hecho $g_i$ son las esquinas. Esto demuestra casi de inmediato que el uso de $f''_i$ que son $\in S$ (es decir, son pdf) y coeficientes convexos $c''_i$ no es suficiente. Se necesita un poco más de trabajo (más arriba) para demostrar el caso más general de que el uso de no negativo $f'_i$ y coeficientes no negativos $c'_i$ tampoco es suficiente.

Curiosamente, una lógica similar diría que la conjetura es cierta para $N=2$ . En este caso, las combinaciones lineales de $f_1, f_2$ es una línea cuya intersección con $S$ (cualquier $S$ (no sólo este caso del tetraedro) es uno o más segmentos de línea. Si elegimos los dos puntos más alejados de estos segmentos de recta (los límites existen ya que $X$ está acotado) como $f'_1, f'_2$ entonces todo puede representarse como plc.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X