38 votos

¿Qué porcentaje de una población necesita una prueba para estimar la prevalencia de una enfermedad? Digamos, COVID-19

Un grupo de personas nos pusimos a discutir qué porcentaje de una población debe someterse a pruebas de COVID-19 para estimar la verdadera prevalencia de la enfermedad. La cosa se complicó, y terminamos la noche (sobre el zoom) discutiendo sobre la detección de la señal y las características de la prueba imaginada. Todavía estoy pensando en ello...

Así que:

  1. Suponiendo una prueba perfecta, ¿cómo se traza la curva de la prueba que reduce el intervalo de confianza en torno a la verdadera tasa de infección de la población?

  2. Suponiendo una prueba imperfecta, ¿cómo se introduce el problema de detección de señales de falsos positivos y negativos de la prueba?

  3. ¿Cómo se modela todo esto a lo largo del tiempo?

Me encantaría una respuesta de libro de texto, una referencia a un artículo (idealmente con matemáticas, no código), o un argumento convincente.

33voto

Alex Puntos 128

1) Haciendo algunas suposiciones sobre el tamaño de la población (a saber, que es lo suficientemente grande como para que un modelo binomial sea apropiado), la prevalencia de una enfermedad en una población en un momento determinado puede obtenerse mediante muestreo muestreo aleatorio simple de las personas y encontrar a los enfermos. Se trata de una variable aleatoria binomial y el intervalo de confianza de Wald para una proporción $p$ es

$$ p \pm 1.96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}$$

La parte de la varianza está limitada por encima de 0,5, por lo que podemos hacer la suposición simplificadora de que la anchura del intervalo de confianza es $\sim 2/\sqrt{n}$ . Por lo tanto, la respuesta a esta parte es que el intervalo de confianza para $p$ disminuye como $1/\sqrt{n}$ . Cuadruplica tu muestra, reduce a la mitad tu intervalo. Ahora, esto se basó en el uso de un intervalo de Wald, que se sabe que es problemático cuando $p$ está cerca de 0 o 1, pero el espíritu sigue siendo el mismo para otros intervalos.

2) Hay que fijarse en parámetros como la especificidad y la sensibilidad.

Sensibilidad es la probabilidad de que una persona enferma sea identificada como tal (es decir, que dé positivo). Especificidad es la probabilidad de que se identifique que una persona sin la enfermedad no la tiene (es decir, que las pruebas sean negativas). Hay muchas otras métricas para las pruebas de diagnóstico encontradas aquí que debería responder a su pregunta.

3) Supongo que esto todavía está en el aire. Hay varios intentos de modelar la infección en el tiempo. Los modelos SIR y sus variantes pueden hacer la suposición simplificadora de que la población es cerrada (es decir, S(t) + I(t) + R(t) = 1) y entonces I(t) puede interpretarse como la prevalencia. En mi opinión, esta suposición no es muy buena, porque es evidente que la población no está cerrada (la gente muere de la enfermedad). En cuanto a la modelización de las propiedades diagnósticas de una prueba, éstas también son una función de la prevalencia. De la regla de Bayes

$$ p(T+ \vert D+) = \dfrac{P(D+\vert T+)p(T+)}{p(D+)}$$

Aquí, $P(D+)$ es la prevalencia de la enfermedad, por lo que si ésta cambia, la sensibilidad también debería cambiar.

13voto

Zolomon Puntos 250

Ha sido contestado por Dimitri Pananos, sólo añadiré que para estimar la prevalencia con precisión preestablecida se necesita un tamaño absoluto de la muestra que es bastante invariable con el tamaño de la población (sólo cuando la muestra es una parte sustancial de la población objetivo se tiene un factor de corrección de población finita no despreciable). Por lo tanto, no hay un porcentaje de la población que deba probarse: el 50% de una población pequeña puede no ser suficiente, el 0,5% de una población grande puede ser suficiente para la misma precisión.

1voto

MaxW Puntos 201

Voy a ir en una dirección algo diferente y decir que depende...

  • Por supuesto, cualquier muestreo se basa en la noción de que el muestreo es realmente aleatorio. Tratar de tener en cuenta la no aleatoriedad de la muestra complica enormemente la situación.

  • Este tipo de medición sí/no es no paramétrica. Estas pruebas necesitan un tamaño de muestra mayor que si la medición fuera paramétrica.

  • Es de suponer que ignoras el problema de los falsos positivos y los falsos negativos en las pruebas. Los falsos positivos podrían ser un verdadero problema si la fracción de la enfermedad es baja.

  • ¿Cuál es la fracción real de enfermos? Si sólo el 0,1% de la población está enferma, entonces una media de 1 de cada 1000 pruebas sería positiva. Por tanto, cuanto menor sea la tasa de infección, mayor deberá ser la muestra.

  • ¿Cómo de precisa es la estimación que quiere? En otras palabras, ¿quiere saber la tasa de infección +/- 20%, o por ejemplo +/- 1%? Cuanto más preciso sea el valor de la tasa de infección, mayor tendrá que ser la muestra.

Existe un tipo de prueba estadística denominada Prueba de Aceptación que puede utilizarse. Básicamente, la decisión importante es la precisión que se desea obtener en la medición. A continuación, se siguen tomando muestras hasta que se alcanza ese nivel de precisión. Así, si el 50% de la población está infectada, se necesita una muestra relativamente pequeña para llegar a un error de +/- 10% en la propia medición (por ejemplo, 50% +/- 5%). Sin embargo, si sólo el 0,5% de la población está infectada, se necesita una muestra mucho mayor para determinar el nivel de la enfermedad (por ejemplo, 0,5% +/- 0,05%).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X