7 votos

¿Cómo se podría estimar (provisionalmente) el número real de infecciones por COVID-19 en una zona, utilizando datos concretos como la tasa de mortalidad ajustada por edad?

Un gran problema de la actual epidemia de COVID-19 es la dificultad para hacerse la prueba (debido a los síntomas leves y a la falta de kits de prueba). Esto hace que los pacientes con pocos o ningún síntoma no puedan saber la probabilidad de estar infectados y seguir propagando la enfermedad.

Hay estimaciones disponibles, pero sólo tienen en cuenta los casos confirmados (y oscilan entre 10x-1000x de este número). ¿Cómo se podrían obtener estimaciones del número de pacientes utilizando características secundarias de la distribución que pudieran ser más robustas? La tasa de mortalidad ajustada por edad en cuidados intensivos podría ser uno de esos parámetros.

enter image description here

6voto

user164061 Puntos 281

Tasa de mortalidad

El uso de la tasa de mortalidad puede funcionar cuando las personas que mueren han adquirido probablemente el virus a nivel local.

Sin embargo, por el momento, muchas personas mueren porque adquirieron el virus durante una visita a otra zona, o porque se contagiaron de otra persona que adquirió el virus en el extranjero.

Por lo tanto, esta cifra basada en la tasa de mortalidad no es muy exacta, a menos que el virus se haya extendido completamente (en cuyo caso será más probable que se infecte desde una fuente local).

Para los casos de Wuhan, Italia y otros epi-centros, que tienen más propagación debido a las infecciones locales que a las extranjeras, la tasa de mortalidad podría ser una buena sonda (aunque todavía hay que lidiar con el retraso).

Además, aunque la tasa de mortalidad puede ser más fiable que el total de casos de infección (basta con pensar que los alemanes, con muchos suministros, están haciendo pruebas con muchos miles de personas, mientras que los países vecinos, con suministros limitados, intentan limitar al máximo el uso de las pruebas), sigue siendo una cifra sesgada. No es fácil determinar la causa de la muerte. A menudo hay una multitud de enfermedades presentes. Si una persona con cáncer o sida contrae una neumonía por el nCoV-19, ¿cuál es la causa? El muestreo de la "causa de la muerte" no está muy claro y se convierte en parte del análisis.

Las estadísticas sólo son útiles para una comparación cuando tienen una base subyacente similar.

  • Edición 1 (estos números no estaban disponibles antes): Sé de el caso de los Países Bajos En el estudio, se comparó el número de muertes covíricas notificadas y el número de muertes totales. Encontraron un aumento de la tasa de mortalidad con unas 2000 personas por semana, pero el número de casos de muerte por covid-19 notificados es sólo de unos 1000 por semana. Por lo tanto, es posible que haya mucha gente que no aparezca en las estadísticas sobre el covid-19 (otra explicación podría ser que la mitad de esas 2000 personas sean covid-19 y la otra mitad sea otra cosa, pero eso es poco probable). Muchas personas no aparecen en las estadísticas porque no mueren en un hospital (sino en su propia casa o en una residencia).

    Mi opinión sobre estas cifras es que los omnipresentes tableros y contadores de casos corona son endebles y débiles y presentan cifras dudosas (sesgadas). La base subyacente es dudosa cuando los números de diferentes fuentes no coinciden.

    Si usted hacer quieren utilizar los números de la tasa de mortalidad que los más rígidos tasa de mortalidad total parecen ser los mejores números (eso significa muerte por todas las causas y no sólo los informes sobre covid-19). Pero estas cifras no suelen ser fáciles de obtener/presentar (al menos no públicamente y estratificadas a escala local) como la imagen de la distribución de los casos en los Países Bajos

    distribution netherlands fuente: Oficina Central de Estadística

    He intentado conseguir este tipo de cosas para varios países, pero no es fácil. Imagino (espero) que esto podría hacerse entre bastidores a nivel internacional. Por ejemplo, el proyecto euromomo . Pero no sé mucho al respecto y sospecho que los datos están mayoritariamente agregados a nivel nacional (lo que hace inútil o al menos no posible hacer imágenes como las anteriores) Pero también imagino que los gobiernos no dedican tiempo a conseguir que estos números sean precisos y en su lugar pierden el tiempo en aplicaciones de corona.

  • Edición 2: Sé de una investigación de la Universidad de Oxford que ha utilizado exactamente su enfoque de utilizar la tasa de mortalidad para estimar la prevalencia.

    El problema es que introducen un parámetro $\rho$ La proporción de la población en riesgo, que es un parámetro muy incierto. Este parámetro $\rho$ es, junto con el tiempo transcurrido entre la introducción del caso o casos índice y la primera muerte notificada, una transformación relativamente sencilla entre el número actual de muertes y el total de la población infectada. Un cálculo similar, pero más sencillo, sin el material bayesiano, se realiza en esta entrada del blog .

    Personalmente soy muy escéptico sobre estos cálculos. Hay algunos cálculos que dan la impresión de ser un método riguroso. Pero, en realidad, sólo se trata de escalar el número actual de muertes con un factor para estimar el número actual de personas infectadas/inmunes. Los números que intervienen en la determinación del factor de escala son muy inciertos y están sesgados. La estimación posterior del número de personas infectadas es tan incierta como la estimación previa del factor $\rho$ y el tiempo transcurrido entre el primer caso índice y la primera muerte (así como otros factores como las estimaciones de la tasa de crecimiento y las estimaciones del tiempo de incubación, y el sesgo en los informes sobre el número de muertes.... es un gran lío)

Datos del viaje

El virus se propaga principalmente de forma irregular por la red. Se propaga de forma diferente a distintas escalas, dentro del hogar, el vecindario, los lugares de trabajo/escuelas, los pueblos, las aglomeraciones, los países, los continentes. Se puede ver cómo el virus se extiende con saltos repentinos de un nodo/comunidad grande a otro nodo/comunidad grande.

Se puede utilizar la presencia del virus en esos nodos/comunidades como variable (por lo que no se cuentan los individuos, ya que no conocemos la presencia en todos los individuos, sino que se cuenta la presencia mucho más conocida del virus en las comunidades), y luego se utiliza un modelo para la dinámica de propagación del virus entre estos diferentes nodos de la red.

Por ejemplo. Por ejemplo, en la región A se encuentran x casos de enfermedad entre las personas que vinieron de la región B e y casos de enfermedad entre las personas que vinieron de la región C, mientras que el viaje a esas regiones es $r$ y $q$ entonces una estimación de la presencia relativa del virus en las regiones B:C puede ser aproximada por (x/r):(y/q).

Recuerdo que había un primer artículo sobre la propagación del COVID-19 (creo que era de estudiosos chinos) que trataba de estimar $R_0$ e incluyó información sobre la frecuencia de los viajes entre las distintas regiones.


Pruebas aleatorias

Se puede realizar la prueba en una muestra de la población que no presenta síntomas y utilizar la prevalencia del virus entre esta muestra para hacer una estimación sobre la prevalencia en toda la población.

Si la prevalencia es muy pequeña, esto requiere una muestra muy grande que podría ser difícil. En ese caso, se puede realizar la prueba entre una muestra en la que la sospecha de la prevalencia sea mayor y obtener alguna información sobre cuántas personas tienen el virus en ese grupo. Dicha medida puede utilizarse para calibrar las estimaciones basadas en información incompleta (es decir, junto con otra información, como la tasa en la que las personas con el virus tienen los síntomas leves o graves particulares, se obtiene una idea sobre cuánto están subestimando las estimaciones actuales el verdadero número de casos).

  • Editar 3 A estas alturas ya se han realizado algunas proyecciones de este tipo. Por ejemplo:

    Cuando lleguen más resultados de este tipo podremos hacer una estimación mucho más rígida sobre la distribución espacial y la prevalencia de la enfermedad.

4voto

enricog Puntos 1653

Parece que hay una entrada del blog que también aborda esta cuestión.

Si hay muertes en su región, puede utilizarlo para adivinar el número de casos reales actuales. Sabemos aproximadamente el tiempo que tarda esa persona en pasar desde que contrae el virus hasta que muere de media (17,3 días). Eso significa que la persona que murió el 29 de febrero en el Estado de Washington probablemente se infectó alrededor del 2/12. Entonces, se conoce la tasa de mortalidad. Para este escenario, estoy utilizando el 1% (más adelante discutiremos los detalles). Eso significa que, alrededor del 2/12, ya había unos ~100 casos en la zona (de los cuales sólo uno acabó en muerte 17,3 días después). Ahora, utiliza el tiempo medio de duplicación del coronavirus (tiempo que tardan en duplicarse los casos, por término medio). Es de 6,2. Eso significa que, en los 17 días que tardó esta persona en morir, los casos tuvieron que multiplicarse por ~8 (=2^(17/6)). Eso significa que, si no se diagnostican todos los casos, una muerte hoy significa 800 casos reales hoy.

Aquí hay otro cuadro de mando con una metodología de estimación similar:

Estimación de la población infectada a partir de las muertes

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X