50 votos

Regresión de Poisson para estimar el riesgo relativo de los resultados binarios

Breve resumen

¿Por qué es más habitual utilizar la regresión logística (con odds ratios) en los estudios de cohortes con resultados binarios, frente a la regresión de Poisson (con riesgos relativos)?

Antecedentes

Según mi experiencia, en los cursos de estadística y epidemiología de grado y posgrado se suele enseñar que la regresión logística debe utilizarse para modelar datos con resultados binarios, con estimaciones de riesgo comunicadas como odds ratios.

Sin embargo, la regresión de Poisson (y otras afines: cuasi-Poisson, binomial negativa, etc.) también puede utilizarse para modelar datos con resultados binarios y, con los métodos adecuados (por ejemplo, el estimador robusto de la varianza en sándwich), proporciona estimaciones de riesgo y niveles de confianza válidos. Por ejemplo

A partir de la regresión de Poisson, se pueden notificar los riesgos relativos, que algunos han argumentado que son más fáciles de interpretar en comparación con las odds ratios, especialmente para los resultados frecuentes, y sobre todo por las personas que no tienen una gran formación en estadística. Véase Zhang J. y Yu K.F., ¿Cuál es el riesgo relativo? Un método para corregir la razón de momios en estudios de cohortes de resultados comunes JAMA. 1998 Nov 18;280(19):1690-1.

De la lectura de la literatura médica, entre los estudios de cohortes con resultados binarios parece que sigue siendo mucho más común informar de las odds ratios de las regresiones logísticas en lugar de los riesgos relativos de las regresiones de Poisson.

Preguntas

Para estudios de cohortes con resultados binarios:

  1. ¿Existe una buena razón para informar de las odds ratios de las regresiones logísticas en lugar de los riesgos relativos de las regresiones de Poisson?
  2. Si no es así, ¿la escasa frecuencia de las regresiones de Poisson con riesgos relativos en la literatura médica puede atribuirse principalmente a un desfase entre la teoría metodológica y la práctica entre científicos, clínicos, estadísticos y epidemiólogos?
  3. ¿Deberían los cursos intermedios de estadística y epidemiología incluir más discusiones sobre la regresión de Poisson para resultados binarios?
  4. ¿Debería animar a los estudiantes y colegas a considerar la regresión de Poisson en lugar de la regresión logística cuando sea apropiado?

31voto

Brettski Puntos 5485

Una respuesta a sus cuatro preguntas, precedida de una nota:

En realidad no es tan común que moderno estudios de epidemiología para informar de una odds ratio a partir de una regresión logística para un estudio de cohortes. Sigue siendo la técnica de regresión de elección para los estudios de casos y controles, pero técnicas más sofisticadas son ahora el estándar de facto para el análisis en las principales revistas de epidemiología como Epidemiología , AJE o IJE . Habrá una mayor tendencia a que aparezcan en las revistas clínicas que informan de los resultados de los estudios observacionales. También habrá algunos problemas porque la regresión de Poisson puede utilizarse en dos contextos: El que te refieres, en el que es un sustituto de un modelo de regresión binomial, y en un contexto de tiempo al evento, que es extremadamente común para los estudios de cohortes. Más detalles en las respuestas a la pregunta concreta:

  1. Para un estudio de cohorte, realmente no. Hay algunos extremadamente casos específicos en los que, por ejemplo, se haya utilizado un modelo logístico a trozos, pero se trata de valores atípicos. El conjunto punto de un estudio de cohortes es que se puede medir directamente el riesgo relativo, o muchas medidas relacionadas, y no hay que depender de un odds ratio. No obstante, haré dos apuntes: Una regresión de Poisson suele estimar una tasa , no un riesgo, y por lo tanto la estimación del efecto a partir de ella se anotará a menudo como una razón de tasas (principalmente, en mi opinión, por lo que se puede seguir abreviando RR) o una razón de densidad de incidencia (IRR o IDR). Así que asegúrate de que en tu búsqueda estás buscando los términos correctos: hay muchos estudios de cohortes que utilizan métodos de análisis de supervivencia. Para estos estudios, la regresión de Poisson hace algunas suposiciones que son problemáticas, sobre todo que el riesgo es constante. Por ello, es mucho más común analizar un estudio de cohortes utilizando modelos de riesgos proporcionales de Cox, en lugar de modelos de Poisson, e informar de la consiguiente razón de riesgos (HR). Si se me presionara para nombrar un método "por defecto" con el que analizar una cohorte, diría que la epidemiología está realmente dominada por el modelo de Cox. Esto tiene sus propios problemas, y a algunos epidemiólogos muy buenos les gustaría cambiarlo, pero ahí está.

  2. Hay dos cosas que puede atribuyen la infrecuencia, una infrecuencia que no creo que exista necesariamente en la medida que usted sugiere. Uno de ellos es que sí, la "epidemiología" como campo no es exactamente cerrado, y se obtiene un gran número de artículos de clínicos, científicos sociales, etc., así como de epidemiólogos con diferentes antecedentes estadísticos. El modelo logístico se enseña habitualmente y, según mi experiencia, muchos investigadores recurrirán a la herramienta conocida en lugar de a la mejor.

    La segunda es en realidad una cuestión de lo que se entiende por estudio de "cohorte". Algo como el modelo de Cox, o un modelo de Poisson, necesita una estimación real del tiempo-persona. Es posible obtener un estudio de cohorte que siga a una población algo cerrada durante un período determinado, especialmente en los primeros ejemplos de "Introducción a la Epidemiología", donde los métodos de supervivencia como los modelos de Poisson o Cox no son tan útiles. El modelo logístico puede para estimar un odds ratio que, con una prevalencia de la enfermedad suficientemente baja, se aproxima a un riesgo relativo. Otras técnicas de regresión que lo estiman directamente, como la regresión binomial, tienen problemas de convergencia que pueden hacer fracasar fácilmente a un nuevo estudiante. Tenga en cuenta que los artículos de Zou que cita utilizan una técnica de regresión de Poisson para evitar los problemas de convergencia de la regresión binomial. Pero los estudios de cohortes con binomios son en realidad una pequeña porción del "pastel de los estudios de cohortes".

  3. Sí. Francamente, los métodos de análisis de supervivencia deberían aparecer antes de lo que suelen hacerlo. Mi teoría favorita es que la razón de que esto no sea así es que métodos como la regresión logística son más fáciles de código . Las técnicas que son más fáciles de codificar, pero que vienen con advertencias mucho más grandes sobre la validez de sus estimaciones de efectos, se enseñan como la norma "básica", lo cual es un problema.

  4. Debe animar a los estudiantes y colegas a utilizar la herramienta adecuada. En general, para el campo, creo que probablemente sería mejor sugerir la consideración del modelo de Cox en lugar de una regresión de Poisson, ya que la mayoría de los revisores (y deberían) plantear rápidamente las preocupaciones sobre el supuesto de un peligro constante. Pero sí, cuanto antes pueda alejarlos de "¿Cómo meto mi pregunta en un modelo de regresión logística?", mejor estaremos todos. Pero sí, si se trata de un estudio sin tiempo, hay que presentar a los estudiantes tanto la regresión binomial como los enfoques alternativos, como la regresión de Poisson, que pueden utilizarse en caso de problemas de convergencia.

11voto

alexs77 Puntos 36

Yo también especulo sobre la prevalencia de los modelos logísticos en la literatura cuando un modelo de riesgo relativo sería más apropiado. Los estadísticos estamos demasiado familiarizados con la adherencia a las convenciones o con la adhesión a los análisis de "menú desplegable". Esto crea muchos más problemas de los que resuelve. La regresión logística se enseña como una "herramienta estándar" para analizar resultados binarios, en los que un individuo tiene un resultado de tipo sí/no, como la muerte o la discapacidad.

La regresión de Poisson se enseña con frecuencia como método para analizar cuenta . Se subraya que este modelo de probabilidad funciona excepcionalmente bien para modelar resultados 0/1, especialmente cuando son raros. Sin embargo, un modelo logístico también se aplica bien con resultados poco frecuentes: la razón de probabilidades es aproximadamente una razón de riesgo, incluso con un muestreo dependiente del resultado, como en los estudios de casos y controles. No puede decirse lo mismo de los modelos de riesgo relativo o de Poisson.

Un modelo de Poisson también es útil cuando los individuos pueden tener un "resultado" más de una vez, y usted podría estar interesado en la incidencia acumulada, como los brotes de herpes, las hospitalizaciones o los cánceres de mama. Por esta razón, los coeficientes exponenciales pueden interpretarse como coeficientes relativos tarifas . Para insistir en la diferencia entre tasas y riesgos: Si hay 100 casos por cada 1.000 personas-año, pero los 100 casos se dan en un solo individuo, la incidencia (tasa) sigue siendo de 1 caso por cada 10 personas-año. En un entorno de atención sanitaria, todavía hay que tratar 100 casos, y vacunar al 80% de las personas tiene una reducción de la tasa de incidencia del 80% (a priori). Sin embargo, el riesgo de al menos un resultado es 1/1000. La naturaleza del resultado y la pregunta, conjuntamente, determinan qué modelo es el adecuado.

Me preocuparía decir "ajustamos un modelo de regresión de Poisson para la incidencia con el fin de estimar la incidencia relativa tarifas " porque esto puede introducir cierta confusión en cuanto a la naturaleza del resultado y si una persona puede experimentarlo más de una vez. Si está interesado en los riesgos relativos, debe decirlo, y estar preparado para discutir las sensibilidades de la suposición de varianza inadecuada en la que la media es proporcional al resultado cuando los eventos binarios tienen la siguiente relación de varianza media: var(y)=E(y)(1E(y))var(y)=E(y)(1E(y))

Según tengo entendido, si el interés científico radica en estimar tasas relativas, existe un modelo híbrido: la regresión de riesgo relativo, que es un MLG que utiliza la estructura de varianza logística y la estructura de media de Poisson. Es decir: log(E[Y|X])=β0+β1Xlog(E[Y|X])=β0+β1X y var(Y)=E[Y](1E[Y])var(Y)=E[Y](1E[Y]) ,

Por cierto, el artículo de Zhang proporciona una estimación sesgada de la inferencia basada en la estimación del riesgo relativo que no tiene en cuenta la variabilidad del término de intercepción. Se puede corregir el estimador mediante bootstrap.

Para responder a las preguntas concretas:

  1. Si el resultado es raro, son aproximadamente iguales. Si el resultado es común, la varianza del estimador de la tasa relativa de Poisson podría estar sobreinflada, y podríamos preferir el odds ratio como una estimación sesgada pero eficiente de la asociación entre un resultado binario y varias exposiciones. También creo que los estudios de casos y controles justifican el uso de la odds ratio como una medida que no varía con el muestreo dependiente del resultado. Scott y Wild 97 discuten los métodos en torno a esto. Por supuesto, otras revistas podrían no tener revisores estadísticos dedicados.

2.3. Creo que estás culpando y asumiendo en exceso lo que ocurre en la revisión médica y en el mundo académico.

  1. Debes animar a tus alumnos a utilizar modelos adecuados siempre que sea posible.

http://biostats.bepress.com/cgi/viewcontent.cgi?article=1128&context=uwbiostat

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X