5 votos

¿Cuál es el significado del condicional $y|b$

Creo que estoy confundido sobre una cosa muy simple. Cuando decimos que alguna variable se distribuye como una distribución de Poisson y escribimos $y \sim \text{Pois}(\lambda)$ ¿es lo mismo que decir $y|\lambda\sim \text{Pois}(\lambda)$ ?

Recuerdo que al principio pensaba que el condicional estaba pensado para describir cosas que ya sabemos, así que si escribo $y|\lambda$ , supuse que $\lambda$ era una constante conocida. Luego me encontré con casos en los que $\lambda$ era una distribución, así que retroactivamente pensé que $y\sim \text{Pois}(\lambda)$ se utilizó con $\lambda$ como parámetro implícito porque es obvio que $y$ depende de $\lambda$ y muchos libros hacen que algunos parámetros estén implícitos. Además, era inusual pensar en una distribución $\lambda$ como valor conocido. En cualquier caso, podría ser una posible realización de $\lambda$ . Sin embargo, utilizando $y$ (sin condicional), creo que es un poco engañoso, ya que esto implica un marginado $y$ .

Entonces, ¿cuál es la interpretación correcta de la condicional en distribuciones como $y \sim \text{Pois}(\lambda)$ ?

Para describir con mayor claridad dónde pueden confundir ambas interpretaciones de la condicional, tomemos este ejemplo: Supongamos una distribución de Poisson $y_{t}\sim \text{Pois}(\mu_{t})$ donde $\log(\mu_{t}) = X_{t}\beta + b$ . Entonces,

$$cov(y_{t},y_{s})=E[cov(y_{t},y_{s}|b)]+cov[E(y_{t}|b),E[y_{s}|b)]$$

(utilizando la ley de la covarianza total)

Por lo tanto, $y_{t}$ debe entenderse como la distribución de Poisson sin condicional, porque en la parte derecha de esta identidad, estamos utilizando la condicional sobre $b$ .

Como puedes ver, estoy confundido sobre lo que realmente significa $y|\lambda$ frente a un marginado $y$ o una distribución $y$ con el parámetro $\lambda$ .

2voto

Doug Kavendek Puntos 1244

Me parece ambiguo si escribir $y$ o $y \; | \; \lambda$ es correcto. Yo diría que la respuesta depende de si estás en un entorno bayesiano o frecuentista:

  • Si estás siendo bayesiano, a menudo modelarás los parámetros como aleatorios. En ese caso, escribiría $y \;|\; \lambda \; \sim \; F(\cdot\,; \lambda)$ y tendrías alguna prioridad sobre $\lambda$ (que podría utilizar para calcular la distribución marginal de $y$ si lo desea)
  • Si estás siendo frecuentista, piensas en $\lambda$ como algo desconocido pero fijo, por lo que basta con escribir $y \; \sim \; F(\cdot\,; \lambda)$ -- no tendría sentido condicionar en $\lambda$

1voto

Lev Puntos 2212

Como bayesiano, no me hace mucha diferencia pensar en $\mathcal{P}(\lambda)$ como una distribución dada, indexada por un parámetro $\lambda$ o como distribución condicional, condicionada a la realización de una variable aleatoria $\lambda$ . De hecho, en cualquier caso, cuando observo $$ y_1,\ldots,y_n\stackrel{\text{iid}}{\sim}\mathcal{P}(\lambda) $$ los datos se indexan mediante un dado si se desconoce el valor de $\lambda$ . Sea o no este $\lambda$ es la realización de una variable aleatoria no cambia el comportamiento de los datos. Recuerde que sólo hay un realización de $\lambda$ para un conjunto de datos determinado, independientemente de su tamaño. Por lo tanto, incluso suponiendo que $\lambda\sim\pi(\lambda)$ (una determinada distribución a priori elegida por mí), no obtengo observaciones del marginal $$ m(y_i) = \int_0^\infty f(y_i|\lambda)\pi(\lambda)\,\text{d}\lambda $$ sino observaciones del condicional. Por lo tanto, para la función de verosimilitud y la inferencia relacionada, condicionar o no no supone ninguna diferencia, ya que se supone que el parámetro es fijo para los datos en cuestión.

El condicionamiento sólo supone una diferencia cuando se ejecuta un análisis bayesiano, ya que la posterior $$ \pi(\lambda|y_1,\ldots,y_n) \propto f(y_1|\lambda)\cdots f(y_n|\lambda)\pi(\lambda) $$ sólo tiene sentido como distribución condicional a partir de la distribución conjunta $$ \pi(\lambda,y_1,\ldots,y_n) = f(y_1|\lambda)\cdots f(y_n|\lambda)\pi(\lambda) $$ (lo que significa que $\lambda$ tiene que sea una variable aleatoria para que esta derivación tenga sentido).

A nivel probabilístico, suponiendo que el $\sigma$ -en $\mathcal{Y}\times\Theta$ está inducida por los productos de los conjuntos medibles en $\mathcal{Y}$ y en $\Theta$ escribir $p_\lambda(y)$ o $p(y|\lambda)$ tampoco supone ninguna diferencia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X