2 votos

Mejor notación estadística para la densidad de probabilidad esperada

Supongamos que tenemos dos distribuciones normales multivariantes $\mathcal{N}_1 = \mathcal{N}(\mu_1, \Sigma_1)$ y $\mathcal{N}_2 = \mathcal{N}(\mu_2, \Sigma_2)$ . Hacemos estos dos pasos:

  1. Elige un punto, por ejemplo $x$ de $\mathcal{N}_1$ .
  2. calcula $\mathcal{N}_2(x)$ (densidad de probabilidad de x en $\mathcal{N}_2$ ).

¿Qué es el mejor notación estadística correcta mostrar valor esperado para $\mathcal{N}_2(x)$ ?

Las únicas anotaciones que vienen a $E_{x\sim\mathcal{N}_1} \left( \mathcal{N}_2(x) \right)$ y $E_{x\sim\mathcal{N}(\mu_1, \Sigma_1)} \left( p_{\mathcal{N}(\mu_2, \Sigma_2)}(x) \right)$

NOTA 1: En lugar de $\mathcal{N}_1, \mathcal{N}_2$ (subíndices numéricos), tengo que mostrar los parámetros reales $ \left( \mu_1, \Sigma_1, \mu_2, \Sigma_2 \right)$ en la fórmula.

NOTA 2: Ya conozco la solución (Está resuelta ici ). Sólo estoy pensando en la notación correcta.

2voto

Jeff Bauer Puntos 236

Aunque la distribución Normal tiene un estatus especial entre las distribuciones, no veo la necesidad de crear una notación especial aquí, es una carga notacional innecesaria.
Tal y como yo lo veo, tu problema parte del hecho de que utilizas el símbolo de la distribución para denotar también el propio vector aleatorio. Esto es habitual (especialmente en resultados asintóticos), pero estrictamente hablando es incorrecto, porque el vector aleatorio es una entidad separada de la distribución que sigue. Cuando usamos el mismo símbolo para los dos, confundimos mal las cosas.

Así que escribiría " $\mathbf X_1 \sim \mathcal{N}(\mu_1, \Sigma_1)$ " en lugar de " $\mathcal{N}_1 = \mathcal{N}(\mu_1, \Sigma_1)$ "y análogamente para el 2º vector aleatorio. Entonces sólo necesitaría escribir adicionalmente una pieza más de notación muy estándar: "Sea $f_{X_1}(\mathbf x_1)$ sea la función de densidad de $\mathbf X_1$ y $f_{X_2}(\mathbf x_2)$ sea la función de densidad de $\mathbf X_2$ " para poder escribir inmediatamente el valor esperado que desee como

$$E[f_{X_2}(\mathbf X_1)]$$

Lo anterior transmite claramente que la "fuente de aleatoriedad" aquí es $\mathbf X_1$ únicamente, (por lo que el valor esperado debe tomarse con respecto a la densidad conjunta de $\mathbf X_1$ ), ya que $f_{X_2}(\cdot)$ se utiliza únicamente para indicar la forma funcional de esta función de $\mathbf X_1$ . El hecho de que $f_{X_2}(\cdot)$ puede operar también como una función de densidad no tiene aquí consecuencias estocásticas. En esta notación, lo que las distribuciones están involucrados no es evidente, pero yo no veo esto como un problema - después de todo, esta expresión vendrá después de unas pocas líneas de declarar algunos supuestos básicos.

Este caso sirve también para ilustrar la utilidad de utilizar $\mathbf X_1, \mathbf x_1$ para denotar el vector aleatorio y una realización del mismo, respectivamente. También muestra que es útil indexar diferentes vectores aleatorios ( $\mathbf X_1$ , $\mathbf X_2$ o utilizar símbolos diferentes ( $\mathbf X$ , $\mathbf Y$ ), aunque hay que admitir que indexar la misma letra ayuda a tener en cuenta que estos vectores aleatorios pueden tener una distribución idéntica, o al menos distribuciones que pertenecen a la misma familia.

Por último, tenga en cuenta que no tienen algunos condicional valor esperado aquí, ya que $E[f_{X_2}(\mathbf X_1) \mid \mathbf X_1 =\mathbf x_1] =f_{X_2}(\mathbf x_1)$ (no queda ninguna incertidumbre), por lo que el " $\mid$ "debe evitarse.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X