Tengo un modelo de supervivencia con pacientes anidados en hospitales que incluye un efecto aleatorio para los hospitales. El efecto aleatorio está distribuido de forma gamma, y estoy intentando informar de la "relevancia" de este término en una escala que sea fácilmente comprensible.
He encontrado las siguientes referencias que utilizan la Median Hazard Ratio (un poco como la Median Odds Ratio), y la han calculado.
Bengtsson T, Dribe M: Historical Methods 43:15, 2010
Sin embargo, ahora quiero informar de la incertidumbre asociada a esta estimación utilizando el bootstrap. Los datos son de supervivencia y, por tanto, hay múltiples observaciones por paciente y múltiples pacientes por hospital. Parece obvio que tengo que agrupar las observaciones de los pacientes cuando se realiza el remuestreo. Pero no sé si debo agrupar también los hospitales (es decir, remuestrear los hospitales en lugar de los pacientes).
Me pregunto si la respuesta depende del parámetro de interés y, por tanto, sería diferente si el objetivo fuera algo relevante a nivel de paciente en lugar de a nivel de hospital.
Abajo he puesto el código de Stata por si sirve de ayuda.
cap program drop est_mhr
program define est_mhr, rclass
stcox patient_var1 patient_var2 ///
, shared(hospital) ///
noshow
local twoinvtheta2 = 2 / (e(theta)^2)
local mhr = exp(sqrt(2*e(theta))*invF(`twoinvtheta2',`twoinvtheta2',0.75))
return scalar mhr = `mhr'
end
bootstrap r(mhr), reps(50) cluster(hospital): est_mhr