26 votos

En un modelo de Poisson, ¿cuál es la diferencia entre el uso de tiempo como una covariable o un desvío?

Recientemente he descubierto cómo el modelo de las exposiciones a lo largo del tiempo utilizando el registro de (por ejemplo) el tiempo de desplazamiento como en una regresión de Poisson.

Tengo entendido que el desplazamiento corresponde a tener tiempo como covariable con coeficiente 1.

Me gustaría entender mejor la diferencia entre el uso del tiempo como un desplazamiento o un covariable (por lo tanto, estimar el coeficiente). En que situación se desea utilizar un método u otro?

ACTUALIZACIÓN: No sé si es interesante, pero me encontré con una validación de los dos métodos que utilizan al azar dividir los datos repetido 500 veces y me di cuenta de que utilizando el método de desplazamiento conduce a un mayor error de la prueba.

38voto

Sean Hanley Puntos 2428

Las compensaciones pueden ser utilizados en cualquier modelo de regresión, pero son mucho más comunes cuando se trabaja con el conde de datos para la variable de respuesta. Un desplazamiento es sólo una variable que se ve obligado a tener un coeficiente de 1 en el modelo. (Ver también este excelente CV hilo: Cuando el uso de un desplazamiento en una regresión de Poisson?)

Cuando se usan correctamente con los datos de recuento, esto te permitirá modelo de las tasas de cambio de cuenta. Si que es de interés, entonces es algo que hacer. Por lo tanto, este es el contexto en el que los desplazamientos se utilizan con más frecuencia. Vamos a considerar una distribución de Poisson GLiM con un registro de enlace (que es el enlace canónico).
(counts)ln(λ)=β0+β1X(rates)ln(λtime)=β0+β1Xln(λ)ln(time)=β0+β1X(still rates)ln(λ)=β0+β1X+1×ln(time)(counts again)ln(λ)=β0+β1X+β2×ln(time)when β21 (Como se puede ver, la clave para el uso de un desplazamiento correctamente es hacer ln(time) el desplazamiento, no time.)

Cuando el coeficiente de ln(time) no 1, usted ya no es el modelado de las tasas. Pero desde β2(,1)(1,) ofrece mayor flexibilidad para ajustar los datos, los modelos que no utilice ln(time) de desplazamiento como se suelen encajar mejor (aunque también pueden overfit).


Si usted debe de modelo de cuenta o tasas de interés realmente depende de su cuestión de fondo es. Usted debería modelo el que corresponde a lo que usted quiere saber.

En cuanto a lo que puede significar para β2 no 1, consideremos un ejemplo en el que el tiempo no es la variable en cuestión. Imagine estudiar el número de complicaciones quirúrgicas en diferentes hospitales. Un hospital tiene muchos más informado de complicaciones quirúrgicas, pero se puede afirmar que la comparación no es justa, ya que hacer muchos más cirugías. Así que usted decide intentar el control de esta. Usted puede simplemente utilizar el registro de la cantidad de cirugías como un desplazamiento, que permiten el estudio de la tasa de complicaciones por la cirugía. También se podría utilizar el registro de la cantidad de cirugías como otra covariable. Supongamos que el coeficiente es significativamente diferente de 1. Si β2>1, entonces los hospitales que realizan más cirugías tienen una mayor tasa de complicaciones (tal vez debido a que se están apresurando el trabajo para hacer más). Si β2<1, los hospitales que realizan la mayoría tienen menos complicaciones por la cirugía (tal vez ellos tienen los mejores médicos, y así hacer más y hacerlo mejor).

Ver cómo esto podría suceder si la variable en cuestión fueron el tiempo es un poco más complicado. La distribución de Poisson surge del proceso de Poisson, en la que el tiempo entre eventos es exponencialmente distribuido, y por lo tanto, hay una conexión natural para el análisis de supervivencia. En el análisis de supervivencia, el tiempo para los eventos son a menudo no se distribuyen como una exponencial, pero la línea de base de peligro puede ser mayor o menor a lo largo del tiempo. Por lo tanto, considere un caso en el que se modela el número de eventos que ocurren después de algunos punto de partida natural. Si β2>1, lo que significa que la velocidad de los acontecimientos, es el exceso de velocidad, mientras que si β2<1, lo que significa que la tasa de eventos se está desacelerando.

Para un ejemplo concreto de lo anterior, imagine una exploración que cuenta el número de células de cáncer de un período de tiempo después de la inicial del tumor fue extirpado quirúrgicamente. Para algunos pacientes, más tiempo ha transcurrido desde la cirugía y que quería tener esto en cuenta. Ya que una vez que el cáncer ha vuelto a su punto de apoyo, que empezará a crecer de manera exponencial, la tasa será creciente en el tiempo desde la cirugía sin tratamiento adicional.

Para un ejemplo concreto de esto último, considere el número de personas que mueren a causa de un brote de una enfermedad para la que no tenemos el tratamiento. En primer lugar, muchas personas mueren porque eran más susceptibles a la enfermedad, o ya tenían un sistema inmunológico comprometido, etc. A lo largo del tiempo, a medida que la población de personas restantes es menos susceptible a la enfermedad, la tasa de disminución. (Lo siento, este ejemplo es tan morboso.)

8voto

eldering Puntos 3814

El tiempo de los desplazamientos normalmente puede verse como su modelo de estimación de la tasa se produce un evento por unidad de tiempo, con el desplazamiento de controlar cuánto tiempo se observan las diferentes asignaturas.

En los modelos de poisson está siempre en la estimación de una tasa que algo sucede, pero nunca se llega a observar esta tasa directamente. Que hacer llegar a observar el número de veces que ocurre un evento de más de una cierta cantidad de tiempo. El desplazamiento se realiza la conexión entre los dos conceptos.

Por ejemplo, se observó temas de disparo cestas de cantidades variables de tiempo, y se contó el número de canastas para cada sujeto. Lo que usted está realmente interesado en en con qué frecuencia cada sujeto se hunde en una cesta, es decir, el número de cestas de cada sujeto espera a hundirse cada minuto, ya que es una especie de objetivo medida de su habilidad. El número de canastas que realmente observada hundido entonces sería esta estimación de la tasa de veces cuánto tiempo se observa el tema de intentar. Así que usted puede pensar en términos de las unidades de la respuesta, el número de cestas por minuto.

Es difícil pensar en una situación en donde el tiempo de uso observa como una covariable en una regresión de poisson, ya que por su propia naturaleza, está en la estimación de una tasa.

Por ejemplo, si quiero, para evaluar el efecto de américa vs europea (muy tonto ejemplo) en el número de basket, adición de tiempo como una covariable me permitiría evaluar el efecto de manera "independiente" desde que pasó el tiempo grabando, ¿no? Además, también me dan una estimación del efecto del tiempo sobre el resultado.

He aquí un ejemplo que espero que pone de relieve el peligro de esto. Suponga que los Estadounidenses y los Europeos, en verdad, el lavamanos, el mismo número de cestas de cada minuto. Pero decir que hemos observado cada Europea para el doble de tiempo que cada uno de los Americanos, por lo que, en promedio, se han observado dos veces tantas canastas para cada Europea.

Si establecemos un modelo que incluye los parámetros de tanto tiempo observado y un indicador de "Europeos", entonces estos dos modelos explican los datos:

E(baskets)=2ct+0xEropean E(baskets)=0t+2cxEropean

(donde c es una constante, que es la verdadera tasa de que ambos tipos de jugadores hacer cestas).

Como un estadístico, que realmente queremos, en esta situación, nuestro modelo para informarnos de que no hay diferencia estadística entre la tasa a la que los Europeos hacen cestas y la tasa a los Estadounidenses a hacer cestas. Pero nuestro modelo no ha podido hacerlo, y nos hemos quedado confundidos.

El problema es que nosotros sabemos algo que nuestro modelo no saber. Es decir, hemos de saber que, si observamos la misma persona dos veces como mucho tiempo, que, a la expectativa, se hará dos veces la cantidad de canastas. Ya que sabemos esto, debemos decirle a nuestro modelo. Esto es lo que el desplazamiento se realiza.

Tal vez usando el método de desplazamiento es apropiado cuando sabemos que los eventos suceden uniformily a lo largo del tiempo!

Sí, pero esto es una suposición de la distribución de poisson modelo en sí. Desde la página de la wikipedia sobre la distribución de poisson

la distribución de Poisson, nombrada después del matemático francés Siméon Denis Poisson es una distribución de probabilidad discreta que expresa la probabilidad de un número de eventos que ocurren en un intervalo fijo de tiempo y/o espacio, si estos eventos ocurren con una tasa promedio e independientemente del tiempo transcurrido desde el último evento.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X