6 votos

¿Por qué el proceso gaussiano tiene la propiedad de marginalización/consistencia?

Según el libro GPML, " ... Un proceso gaussiano se define como una colección de variables aleatorias. Así, la definición implica automáticamente un requisito de consistencia, ...". ¿Puedo saber por qué esta definición define automáticamente el requisito de consistencia? ¿Qué es también la propiedad de marginalización?

4voto

Dilip Sarwate Puntos 16161

Un proceso gaussiano $\{X(t)\colon t \in \mathbb T\}$ no se define sólo como a colección de variables aleatorias gaussianas; también existe el requisito de que

para cada $n \geq 1$ toda colección finita $\{X(t_1), X(t_2), \cdots, X(t_n)\colon t_1, t_2, \cdots, t_n \in \mathbb T\}$ de $n$ Las variables aleatorias del proceso disfrutan de una distribución gaussiana multivariante (también llamada gaussiana conjunta).

La definición más sencilla de un proceso gaussiano utilizada por la OP restringe $n$ ser justo $1$ . Ahora bien, si $\{X(t_1), X(t_2), \cdots, X(t_n)\colon t_1, t_2, \cdots, t_n \in \mathbb T\}$ son conjuntamente gaussianas, entonces también cualquier subconjunto no vacío de dos o más de estas variables disfruta de una distribución conjuntamente gaussiana y, por supuesto, cada una de las variables aleatorias es individualmente (es decir, marginalmente) gaussiana. Además, estas distribuciones marginales son coherente la distribución de $X(t_1)$ obtenida por marginación a partir de la distribución conjunta de $\{X(t_1), X(t_2)\}$ no puede ser diferente de la distribución de $X(t_1)$ obtenida por marginación a partir de la distribución conjunta de $\{X(t_1), X(t_3)\}$ porque ambas se obtienen a partir de la marginación de la distribución trivariante gaussiana conjunta de $\{X(t_1), X(t_2), X(t_3)\}$ .

Por lo tanto, el requisito de coherencia está incluido en la definición correcta de un proceso gaussiano.

3voto

luckynoob Puntos 27

En realidad es una buena pregunta que muestra una sutileza de la definición de un proceso estocástico general (no necesariamente gaussiano). Y espero que no sea demasiado tarde para usted.

En GPML, dice Gaussian Process definition in GPML Un proceso estocástico se define como una colección de variables aleatorias con una ley . Dado que estas variables aleatorias son a su vez mapeos de un espacio de probabilidad a un espacio medible, ya existen medidas de probabilidad en este espacio de probabilidad en el que se define el proceso estocástico. Por lo tanto, la ley del proceso estocástico ya está implícita en la colección de variables aleatorias. Esto está garantizado por Teorema de extensión de Kolmogorov

Este teorema tiene varios nombres:

1.Teorema de extensión de Kolmogorov: se centra en el hecho de que la ley de este proceso estocástico se extiende (naturalmente) a partir de la ley de la colección de variables aleatorias.

2.Teorema de existencia de Kolmogorov: se centra en el hecho de que el proceso estocástico existe, en el sentido de que es realmente algo "aleatorio" dotado de una ley. (No es una simple colección de variables aleatorias)

3.Teorema de consistencia de Kolmogorov: centrado en el hecho de que si suponemos que el proceso estocástico existe, entonces su ley debe ser consistente con las leyes de sus componentes (las variables aleatorias).

Aplicando el teorema a esta cuestión en particular: al definir un proceso gaussiano, definimos su ley a través de la ley de cualquier subconjunto de dimensión finita de la colección, donde basta con especificar la función de covarianza (la función media no es esencial para la ley, ya que es sólo una traslación).

Así que

¿Puedo saber por qué esta definición define automáticamente el requisito de coherencia?

no es automático, Teorema de extensión de Kolmogorov está detrás. (El tercer aspecto).

¿Cuál es también la propiedad de marginación?

En la misma página de Wikipage, el condiciones de coherencia (2) dice:

  1. para todos los conjuntos medibles $F_{i} \subseteq \mathbb{R}^{n}, m \in \mathbb{N}$ $$ \nu_{t_{1} \ldots t_{k}}\left(F_{1} \times \cdots \times F_{k}\right)=\nu_{t_{1} \ldots t_{k}, t_{k+1}, \ldots, t_{k+m}}(F_{1} \times \cdots \times F_{k} \times \underbrace{\mathbb{R}^{n} \times \cdots \times \mathbb{R}^{n}}_{m}) $$

Significa básicamente que si mido un subconjunto, no hay diferencia en la medida que utilice, ya sea conjunta o marginal, siempre que el subconjunto sea medible (contenido en el espacio medible donde se define la medida).

Le recomiendo encarecidamente que lea la página Wikipage para obtener más información.

Eso es todo.

@whuber gracias por recordarlo, lo he corregido.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X