4 votos

Matriz de varianza/covarianza robusta en la regresión de Poisson

Supongamos que tengo datos de supervivencia con más de una fila por sujeto, porque he dividido el tiempo de seguimiento de cada sujeto en trozos (tal vez porque tengo una o más variables que varían en el tiempo o tal vez sólo porque quiero ajustar un modelo de Poisson con un peligro no constante en el tiempo).

¿Tengo que utilizar el estimador robusto de la varianza/covarianza (que se implementa por ejemplo en Stata con la opción vce(cluster clustvar) ) para tener en cuenta que tengo más de una observación por sujeto (es decir, que no son independientes)?

Editar (15 de marzo de 2012) :

Lambert y Royston en su libro realizan este análisis: dividen el seguimiento de cada sujeto en una escala de tiempo (digamos la edad alcanzada)[*] y ajustan una regresión de Poisson que incluye la edad alcanzada como variable dependiente (modelada, por ejemplo, mediante splines) más el offset, de modo que es posible modelar la incidencia de alguna enfermedad en función de la edad alcanzada.

Ellos no utilizar el estimador robusto de varianza/covarianza, pero no he encontrado en el texto ninguna explicación de por qué las filas individuales (o episodios ) pueden considerarse independientes.

La pregunta: ¿Puede alguien explicarme por qué las filas simples (o episodios ) pueden considerarse independientes?

[*]Para aclarar lo que se ha hecho, tomemos por ejemplo el tema número 1001 . Entra en el estudio en 80.00219 años de edad y desarrollan la enfermedad a 85.037236 años ( _d==1 ). Esto es lo que ocurre con el registro de este tema después de dividirlo. (La variable de desplazamiento se define como ln(_t-_t0) )

  id   _d          _t        _t0  
1001    0          81   80.00219  
1001    0          82         81  
1001    0          83         82  
1001    0          84         83  
1001    0          85         84  
1001    1   85.037236         85

1voto

ojrac Puntos 973

Gracias al comentario de @guest y a esto Nota de la conferencia por Germán Rodríguez, creo que mi pregunta ha sido respondida.

De la nota de la conferencia de G.R:

Es importante señalar que no suponemos que el $d_{ij}$ tienen distribuciones de Poisson independientes, porque claramente no . Si el individuo $i$ murió en el intervalo $j(i)$ entonces debe haber estado vivo en todos los intervalos anteriores $j < j(i)$ por lo que es imposible que los indicadores sean independientes. Además, cada indicador sólo puede tomar los valores uno y cero, por lo que no podría tener una distribución de Poisson, que asigna alguna probabilidad a los valores mayores que uno. El resultado es más sutil. Son las funciones de probabilidad las que coinciden. Dada una realización de un proceso de supervivencia exponencial a trozos, podemos encontrar una realización de un conjunto de observaciones independientes de Poisson que resulte tener la misma verosimilitud y, por tanto, conduzca a las mismas estimaciones y pruebas de hipótesis.

Además, sólo ahora me doy cuenta de que Royston y Lambert dan una breve respuesta a mi pregunta en su libro (página 53) (se me pasó la primera vez que lo leí y me disculpo con los autores):

Nosotros [Royston y Lambert] no estamos asumiendo realmente que el $d_{ij}$ tienen distribuciones de Poisson independientes. Sin embargo, cuando expresamos el modelo de esta manera, la función de verosimilitud es equivalente a la de un modelo exponencial a trozos.

Sin embargo, para una explicación más detallada y en profundidad, lea las notas de G.R.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X