Digamos que cada niño tira una moneda sesgada para determinar si tienen o no el cáncer. Si asumimos que la probabilidad de cabezas (cáncer) que es de 1,6/100.000 habitantes, podemos encontrar la distribución de cáncer de cuenta, esperaríamos que el uso de una distribución binomial.
En R
código, podemos encontrar la distribución con la dbinom
comando:
dbinom(x = 0:5, size = 38000, prob = 1.6/100000)
Aquí, x
el número de casos (0:5
significa que estamos buscando en la probabilidad de 0 casos, 1 caso, etc. hasta 5). El tamaño es el número de niños, y prob es la base de la probabilidad citado.
Después de la limpieza de la salida ligeramente, se obtiene una tabla como esta:
number_of_cases probability
0 0.54444
1 0.33102
2 0.10063
3 0.02039
4 0.00310
5 0.00038
Así que usted esperaría encontrar 3 casos de 38.000 niños sólo el 2% del tiempo en virtud de este modelo, y casi nunca se encuentra más que eso.
En resumen, (suponiendo que las cifras son comparables), parece que en el lado de alta, y que vale la pena investigar más a fondo. Pero no necesariamente tenemos que invocar a los factores especiales más allá de azar para explicar la diferencia.
Editado para añadir: Por EpiGrad comentario, he añadido una imagen que muestra cómo estas probabilidades puede cambiar si nosotros no estaban seguros acerca de la línea de base de la probabilidad de 1,6 casos por cada 100 mil. Los puntos rojos son los valores que se enumeran más arriba, y la nube de puntos que representan lo que sería de esperar si la
Para este ejemplo, probé las líneas de base a partir de una distribución beta usando rbeta(1000, 1.6, 100000 - 1.6)
, que tiene una media de 1,6 casos por cada 100 mil, y algunos de difundir en cualquier lado, pero no caer por debajo de 0. La cantidad de propagación puede o puede no ser razonable, dependiendo de los supuestos que le gustaría hacer. Mi sensación es que he incluido más de la variación que debería, pero quién sabe.
Como se puede ver en la trama, que si los Británicos figuras subestimados en el "real" pre-Fukushima tasa de incidencia de cáncer en Japón, esperamos ver 3 casos por 38k tan a menudo como el 20% del tiempo. Si usted piensa que es probable que depende de otra información fuera del alcance de este problema, como ya he incluido una cantidad adecuada de la incertidumbre de los Británicos estimación.