Quiero estudiar la relación entre competencia hospitalaria y mortalidad. La competencia a la que se enfrenta un hospital se mide por el índice Herfindalh-Hirschman (IHH). Así que quiero saber si el IHH de un hospital es menor (es decir, si se enfrenta a más competidores) si su mortalidad disminuye. Tengo tres tipos de variables Variables a nivel de paciente (edad, sexo, diagnóstico...), variables a nivel de hospital como el IHH (El Predictor), la condición pública o privada del hospital, etc., y variables relacionadas con la zona de residencia del paciente (Índice de Desventaja Social del municipio de residencia del paciente). Así pues, decidí realizar una regresión logística de 2 niveles. El resultado (mortalidad = sí/no), así como todas las demás variables a nivel de paciente, son variables de nivel 1. Las variables a nivel de hospital son variables de nivel 2. Las variables a nivel de hospital son variables de nivel 2. Ahora me planteo la siguiente pregunta: ¿qué nivel deberían tener las variables a nivel de área? ¿Deberían ser también variables de nivel 2 como las variables a nivel de hospital, sabiendo que los hospitales donde se trata a los pacientes y los municipios donde viven los pacientes no son el mismo tipo de conglomerados y que un paciente determinado pertenece a ambos tipos de conglomerados al mismo tiempo? ¿O debería existir una jerarquía entre los hospitales y la zona de residencia del paciente? Por último, no sé si debería hacer un modelo de efectos fijos o un modelo de efectos aleatorios (con sólo un intercepto aleatorio o con un intercepto y una pendiente aleatorios). Tenga en cuenta que tengo cientos de municipios (áreas) y cientos de hospitales. Cientos o incluso miles de pacientes en cada municipio y cada hospital.
Respuesta
¿Demasiados anuncios?No hay por qué tener una jerarquía estricta. En principio, se podría pensar en agrupaciones de zonas para pacientes separadas de las agrupaciones de zonas para hospitales. Se perdería la estructura jerárquica, pero se ganaría en precisión. Si se siente obligado a tener un único grupo de áreas, tendrá que tomar esa decisión basándose en su comprensión del tema. O, en lugar de clusters de área para pacientes, podría considerar algo como la distancia entre el domicilio del paciente y el hospital, que podría asociarse con el resultado.
Perderá potencia rápidamente con un gran número de efectos fijos y efectos aleatorios. información sobre la piscina entre grupos, ponderando por los números de cada grupo. No obstante, algunas variables podrían incorporarse mejor como efectos fijos. Si su interés principal es el IHH, probablemente debería ser un efecto fijo. Para otras, piense detenidamente si tiene sentido una estructura de anidamiento determinada. Por ejemplo, ¿espera que la relación entre el resultado y el género varíe entre hospitales, entre áreas, etc.? Para los efectos aleatorios, la elección de modelos de sólo intercepción o de intercepción más pendiente (y cualquier elección asociada de estructura de correlación intercepción-pendiente) es una cuestión para el tema en cuestión.
Con un estudio de tal envergadura, convendría recurrir a la ayuda de un estadístico local con experiencia en este tipo de modelos.