6 votos

Probabilidad condicional con procesos de Poisson

Soy leyendo una sección sobre modelos logísticos condicionales en los que se utiliza un proceso de Poisson heterogéneo para hacer inferencias en la cartografía de enfermedades. Básicamente, la probabilidad de un proceso de Poisson se utiliza para describir los eventos $\{s\}$ dentro de una región espacial $T$

$$L(\{s\}|\Psi) = \frac{1}{m!}\prod_{i=1}^{m}\lambda(s_{i}|\Psi)\exp\{\Lambda_{T}\} $$

donde $\Lambda_{T} = \int_{T}\lambda(u|\Psi)du$ . $\lambda(s)$ se denomina intensidad. Esta cantidad determina la tasa de eventos de casos (casos detectados de enfermedad, por ejemplo) y $\Lambda_{T}$ es la intensidad en la región $T$ .

Por lo general, para los eventos del caso, $\lambda(s|\Psi)$ viene dada por $\lambda_{0}(s|\Psi_{0})\lambda_{1}(s|\Psi_{1})$ en el que $\lambda_{0}(s|\Psi_{0})$ es una "función espacialmente variable de la población de riesgo de la enfermedad en cuestión" y $\lambda_{1}(s|\Psi_{1})$ incluye predictores apropiados.

Sin embargo, en el caso de la modelización de casos y controles, no entiendo qué cálculo se realiza. Cito el párrafo correspondiente:

Cuando se dispone de una realización bivariada de casos y controles es es posible hacer una inferencia condicional sobre esta realización conjunta. Defina los eventos de caso como $s_{i} : i = 1, ..., m$ y el control eventos como $s_i : i = m + 1, ...., N$ donde $N = m + n$ el número total número de eventos. A cada lugar se le asocia una variable binaria ( $y_i$ ) que etiqueta el evento como un caso ( $y_i = 1$ ) o un control ( $y_i = 0$ ). Supongamos también que los modelos de procesos puntuales que rige cada tipo de evento (caso o control) es un proceso de Poisson heterogéneo heterogéneo con intensidad $\lambda(s|)$ para los casos y $\lambda_0 (s|_{0})$ para los controles. La superposición de los dos procesos es también un proceso de Poisson heterogéneo con intensidad $_0(s|_0) + (s|) = _0 (s|_0 )[1+_1 (s|_1 )]$ . Condición de la realización conjunta de estos procesos, es fácil deducir la probabilidad condicional de un caso en cualquier momento. la probabilidad condicional de un caso en cualquier lugar como

$$Pr(y_{i}=1) = \frac{_0(s_i |_0 )_1(s_i |_1 )}{_0 (s_i |_0 )[1 + _1 (s_i |_1 )]} = p_{i}$$

$$Pr(y_{i}=0) = \frac{1}{1 + _1 (s_i |_1)} = 1-p_{i}$$

¿Qué está calculando el autor en estas ecuaciones? Parece ser la probabilidad de un caso y un control respectivamente. Sin embargo, si un proceso de Poisson está modelando cada tipo de evento, no veo rastros de un proceso de Poisson allí.

Además, utilizando las ecuaciones anteriores, la probabilidad es:

$$L(\Psi_{1}|s) = \prod_{i\in \text{cases}}p_{i}\prod_{i\in \text{controls}}(1-p_{i})$$

que parece muy razonable, excepto por el acondicionamiento en $s$ en lugar de condicionar los parámetros $\Psi$ .

Agradecería cualquier ayuda.

ACTUALIZACIÓN : Puede encontrar esta sección disponible en Google Books utilizando este enlace .

1voto

jsk Puntos 493

Si se asume que los eventos de control llegan con velocidad $\lambda_0$ y los eventos del caso llegan con la tasa $\lambda$ , entonces el número total de eventos que ocurren suceden con la tasa $\lambda_0 + \lambda$ . Ahora, condicionado a que ocurra un evento, entonces se podría calcular la probabilidad de que sea un caso,

$P(Y=1 \vert N=1) = P(Y=1, N=1)/P(N=1)$ $ = P(1 \text{ case event and } 0 \text{ control events})/P(N=1)$ $ = P(1 \text{ case event})* P(0 \text{ control events})/P(N=1) \text{ (independence of case and control events) }$ $= [\lambda^1e^{-\lambda}/1! * \lambda_0^0e^{-\lambda_0}/0!]/ [ (\lambda_0+\lambda)^1e^{-(\lambda+\lambda_0})/1!] \text{ (poisson process probabilities)}$
$ = \lambda e^{-\lambda} e^{-\lambda_0}/[ (\lambda_0+\lambda)e^{-(\lambda+\lambda_0)} = \lambda/(\lambda_0+\lambda) = \lambda_0\lambda_1/(\lambda_0(1+\lambda_1)) =\lambda_1/(1+\lambda_1) $

Recordemos que para un proceso poisson con tasa $\lambda$ P(k eventos) = $\lambda^ke^{-\lambda}/k!$

Del mismo modo, la probabilidad condicional de que se trate de un control puede ser $1/(1+\lambda_1)$

Obsérvese que la probabilidad de caso o de control condicionada a la ocurrencia de un evento depende únicamente de $\lambda_1$ y $1+\lambda_1$ podría considerarse como el aumento relativo de las tasas de eventos para los casos. Si $\lambda_1$ es su parámetro de interés, entonces no hay nada malo en utilizar el modelo logístico condicional para estimar los parámetros que componen el predictor lineal $\lambda_1$ .

Las suposiciones en el cálculo de las probabilidades condicionales están supeditadas a la superposición declarada de los dos procesos de Poisson independientes. La probabilidad, $L(\Psi_1 \vert s, N) = P( s \vert \Psi_1, N)$ es en realidad la probabilidad condicional de los datos observados $s$ los eventos del caso y del control, dados los parámetros $\Psi_1$ y el número total de eventos observados N. Nótese que me doy cuenta de que la notación de la función de verosimilitud es confusa en su escritura, pero una verosimilitud no es la probabilidad condicional de los parámetros dados los datos, sino que es realmente la probabilidad de los datos dados los parámetros.

Además, lo bueno de este enfoque es que no hay que estimar los parámetros del proceso de Poisson para los controles, $\Psi_0$ si lo único que te importa son los parámetros de $\Psi_1$ .

Este enlace también puede ser útil, los teoremas 1, 2 y 3 son relevantes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X