5 votos

Cálculo de intervalos de confianza para la prevalencia de varios tipos de infección

Tengo un conjunto de datos sobre una población hospitalizada, y qué tipo de infecciones tienen los pacientes.

Digamos que el número de pacientes es 100, 10 de ellos tienen neumonía (group A) 20 de ellos tienen infección urinaria (group B) Tenga en cuenta que los grupos A y B pueden solaparse, es decir, que un paciente con neumonía también puede tener una infección urinaria.

Necesito estimar la prevalencia de diferentes tipos de infección en esta población (es decir, prevalencia de neumonía, prevalencia de infección del tracto urinario). No estoy seguro de si asumir una distribución binomial, como la que se muestra a continuación de aquí es apropiado:

$$\text{SE}=\sqrt{\frac{p\times (1-p)}{n}}\times\sqrt{1-f}$$

Utilizando esta fórmula, calcularé múltiples estimaciones "binomiales" (es decir, una para cada tipo de infección). Me sentiría cómodo utilizando esto si sólo necesitara describir la prevalencia de un tipo de infección, pero en este caso, necesito describir varias de la misma población. No estoy seguro de si utilizar la fórmula es apropiado o no en este caso. ¿Alguien me lo puede aclarar? Gracias.

36voto

James Sutherland Puntos 2033

Así que tenemos una población cada una de las cuales puede tener cero o más afecciones. Para responder a la pregunta ¿Cuántos pacientes hospitalizados tienen A? Me parece que lo mejor que puedes hacer es tomar tu estimador de proporciones favorito y ofrecerlo con tu intervalo de confianza favorito. Hay muchas opciones, que marcarán la diferencia para proporciones muy altas o muy bajas. Si te encuentras en una situación así, puede que el estimador anterior no sea el óptimo.

Si sólo le interesa la población de su hospital, puede prescindir por completo de las estadísticas, como señala SheldonCooper. Sin embargo, sospecho que te interesan los pacientes del hospital en general, por lo que tus errores estándar e intervalos podrían interpretarse en relación con esta población. En el estimador que sugieres, la identidad de la población determinará lo que es 1-F. Ciertamente, los pacientes hospitalizados no se parecen a los no hospitalizados con respecto a las condiciones que usted está contando, pero eso no tiene por qué importar.

Siguiendo la segunda observación de Sheldon, es probable que las condiciones se correlacionen. Pero por lo que veo, esta información sólo es útil si se hacen preguntas condicionales, por ejemplo, la prevalencia de A entre los enfermos de B. En términos probabilísticos, tu pregunta trata de estimar marginales, y la información sobre correlaciones sólo te dice cómo estimar condicionales. En términos probabilísticos, tu pregunta se refiere a la estimación de marginales, y la información sobre correlaciones sólo te informa sobre la estimación de condicionales.

Si usted eran interesado en este tipo de subgrupos, sin duda querrá modelar esta información. También se querría si hubiera errores de medición diferenciales o problemas de selección de muestras, etc., por ejemplo, que sólo te hicieran la prueba A si tienes un diagnóstico B... Eso también podría hacer que ciertos marginales muestrales fueran problemáticos como estimaciones de marginales poblacionales. Por suerte, no sé mucho sobre poblaciones hospitalarias, pero apostaría a que existen algunos de estos problemas.

Por último, sobre los informes: Si de hecho quieres denunciar la confianza regiones en lugar de en función de las condiciones intervalos Pero, de nuevo, la estructura de correlación importa y las cosas se complican considerablemente. Creo recordar que Agresti tenía un artículo sobre intervalos de confianza simultáneos para proporciones binomiales multivariantes, que podría ser útil para este enfoque.

1voto

Brettski Puntos 5485

Algunas reflexiones:

  1. Como ya se ha dicho, si se dispone de datos de toda la población del hospital y todas las preguntas se limitan a ese hospital, se puede prescindir por completo del intervalo de confianza. Sin embargo, suponiendo que ese no sea el caso, y que tengas una submuestra del hospital, o quieras hablar del hospital como una muestra de la población general...

    • Probablemente puedas ignorar la dependencia entre infecciones. Es improbable que no estén perfectamente correlacionadas entre sí, pero cuanto más se examina la correlación entre las infecciones y las diversas y variadas violaciones de sucesos independientes (básicamente, el riesgo para usted es independiente del estado de mi enfermedad), más comienzan a romperse las estadísticas simples en ID. Para algo así, probablemente estés bien.

    • Estoy bastante seguro de que puedes utilizar la fórmula tal y como se indica. No vas a agrupar los resultados y, por lo que has dicho, no vas a hacer ningún tipo de comparación entre grupos. Si estamos asumiendo que son independientes, eso no es menos válido que estimar independientemente la prevalencia de otras dos cosas no relacionadas en la misma población. Esto no es cierto si quieres empezar a hablar de prevalencias conjuntas o similares, pero parece que sólo quieres una tabla de Condición Prev (IC 95%).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X