Así que tenemos una población cada una de las cuales puede tener cero o más afecciones. Para responder a la pregunta ¿Cuántos pacientes hospitalizados tienen A? Me parece que lo mejor que puedes hacer es tomar tu estimador de proporciones favorito y ofrecerlo con tu intervalo de confianza favorito. Hay muchas opciones, que marcarán la diferencia para proporciones muy altas o muy bajas. Si te encuentras en una situación así, puede que el estimador anterior no sea el óptimo.
Si sólo le interesa la población de su hospital, puede prescindir por completo de las estadísticas, como señala SheldonCooper. Sin embargo, sospecho que te interesan los pacientes del hospital en general, por lo que tus errores estándar e intervalos podrían interpretarse en relación con esta población. En el estimador que sugieres, la identidad de la población determinará lo que es 1-F. Ciertamente, los pacientes hospitalizados no se parecen a los no hospitalizados con respecto a las condiciones que usted está contando, pero eso no tiene por qué importar.
Siguiendo la segunda observación de Sheldon, es probable que las condiciones se correlacionen. Pero por lo que veo, esta información sólo es útil si se hacen preguntas condicionales, por ejemplo, la prevalencia de A entre los enfermos de B. En términos probabilísticos, tu pregunta trata de estimar marginales, y la información sobre correlaciones sólo te dice cómo estimar condicionales. En términos probabilísticos, tu pregunta se refiere a la estimación de marginales, y la información sobre correlaciones sólo te informa sobre la estimación de condicionales.
Si usted eran interesado en este tipo de subgrupos, sin duda querrá modelar esta información. También se querría si hubiera errores de medición diferenciales o problemas de selección de muestras, etc., por ejemplo, que sólo te hicieran la prueba A si tienes un diagnóstico B... Eso también podría hacer que ciertos marginales muestrales fueran problemáticos como estimaciones de marginales poblacionales. Por suerte, no sé mucho sobre poblaciones hospitalarias, pero apostaría a que existen algunos de estos problemas.
Por último, sobre los informes: Si de hecho quieres denunciar la confianza regiones en lugar de en función de las condiciones intervalos Pero, de nuevo, la estructura de correlación importa y las cosas se complican considerablemente. Creo recordar que Agresti tenía un artículo sobre intervalos de confianza simultáneos para proporciones binomiales multivariantes, que podría ser útil para este enfoque.