1) Haciendo algunas suposiciones sobre el tamaño de la población (a saber, que es lo suficientemente grande como para que un modelo binomial sea apropiado), la prevalencia de una enfermedad en una población en un momento determinado puede obtenerse mediante muestreo muestreo aleatorio simple de las personas y encontrar a los enfermos. Se trata de una variable aleatoria binomial y el intervalo de confianza de Wald para una proporción $p$ es
$$ p \pm 1.96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}$$
La parte de la varianza está limitada por encima de 0,5, por lo que podemos hacer la suposición simplificadora de que la anchura del intervalo de confianza es $\sim 2/\sqrt{n}$ . Por lo tanto, la respuesta a esta parte es que el intervalo de confianza para $p$ disminuye como $1/\sqrt{n}$ . Cuadruplica tu muestra, reduce a la mitad tu intervalo. Ahora, esto se basó en el uso de un intervalo de Wald, que se sabe que es problemático cuando $p$ está cerca de 0 o 1, pero el espíritu sigue siendo el mismo para otros intervalos.
2) Hay que fijarse en parámetros como la especificidad y la sensibilidad.
Sensibilidad es la probabilidad de que una persona enferma sea identificada como tal (es decir, que dé positivo). Especificidad es la probabilidad de que se identifique que una persona sin la enfermedad no la tiene (es decir, que las pruebas sean negativas). Hay muchas otras métricas para las pruebas de diagnóstico encontradas aquí que debería responder a su pregunta.
3) Supongo que esto todavía está en el aire. Hay varios intentos de modelar la infección en el tiempo. Los modelos SIR y sus variantes pueden hacer la suposición simplificadora de que la población es cerrada (es decir, S(t) + I(t) + R(t) = 1) y entonces I(t) puede interpretarse como la prevalencia. En mi opinión, esta suposición no es muy buena, porque es evidente que la población no está cerrada (la gente muere de la enfermedad). En cuanto a la modelización de las propiedades diagnósticas de una prueba, éstas también son una función de la prevalencia. De la regla de Bayes
$$ p(T+ \vert D+) = \dfrac{P(D+\vert T+)p(T+)}{p(D+)}$$
Aquí, $P(D+)$ es la prevalencia de la enfermedad, por lo que si ésta cambia, la sensibilidad también debería cambiar.