6 votos

¿Incidence Rate Ratio (IRR) in R from linear regression using log-transformed data?

Me preguntaba si tendría sentido calcular la TIR para MCO (no poisson), pero la MCO se realiza utilizando datos transformados logarítmicamente. Tengo un conjunto de datos de la tasa bruta de mortalidad (que todavía estoy debatiendo si son datos de recuento (porque son, después de todo, sobre la base de los recuentos) o datos continuos (ya que no son números enteros), y los he modelado utilizando poisson, pero entonces sólo curiosidad por saber qué pasaría si registro la tasa bruta y luego realizar una regresión lineal robusta.... pero me gustaría comparar las dos formas a través de IRR.....

cualquier sugerencia es bienvenida, por ejemplo, si realmente no debería registrar la tasa bruta para empezar..... Gracias.

3voto

alexs77 Puntos 36

Bien, si su numerador se interpreta directamente como recuentos, entonces tanto la regresión de Poisson como la regresión lineal de resultados transformada logarítmicamente serán consistentes para los mismos parámetros. La única discrepancia en este caso es cómo se ponderan exactamente las observaciones (véase el apartado 2). Si el resultado es tarifas y tienes denominadores medidos (variables) (como 1-3 $\mu$ gs de tumor biopsiado, o 1-20 ccs de sangre), es necesario utilizar algunos enfoques alternativos para tener en cuenta las diversas diferencias de ponderación en los dos grupos. Tanto en la regresión lineal como en la regresión de Poisson, esto se produce en forma de compensación. Tengo curiosidad por saber si esto debería tenerse en cuenta en su problema.

En OLS, la media es independiente de la varianza (según los supuestos clásicos), por lo que el modelo ajustado tendrá los mínimos residuos al cuadrado, que estarán determinados en gran medida por recuentos grandes. En el MLG de Poisson, los recuentos grandes se reducen significativamente mediante la reponderación inversa de la varianza. Una inspección de la distribución de los datos utilizando uno o más gráficos de dispersión (dependiendo del número de variables de ajuste) y curvas ajustadas es una consideración muy importante. Sin duda tendrá que verificar las observaciones de gran influencia para validar los enfoques de modelización alternativos que ha propuesto.

El uso de errores estándar robustos (una forma particular de regresión robusta) no supone que la media sea independiente de la varianza, pero sí utiliza un modelo de probabilidad de trabajo de este tipo, por lo que, aunque los errores estándar robustos serán coherentes, las estimaciones puntuales serán inestables y la inferencia será de menor potencia (que cuando se puede suponer un modelo de probabilidad de trabajo mejor para los datos).

Aunque R le advierte sobre los recuentos no integrales en los MLG de Poisson, hay muchos modelos de regresión sensatos, especialmente en ecología, donde se producen resultados de Poisson no integrales, como la concentración de plancton en un metro cúbico de agua muestreada de varias cuencas hidrográficas, o la concentración de ARNm evaluada por citometría de flujo en tejido tumoral biopsiado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X