La cuestión se plantea en un contexto criptográfico que implica una prueba reguladora de una fuente física o de bits aleatorios, con la hipótesis nula de que son independientes e insesgados. $n$ se extraen muestras de 4 bits ( $n=128$ o $80$ ), el número de muestras $O_i$ en cada una de las 16 franjas se cuenta, y se supone que la fuente es defectuosa si $$65.0<\sum\frac{(O_i-n/16)^2}{n/16}$$
El reglamento aprobado [KS2011] Una propuesta para: Clases de funcionalidad para generadores de números aleatorios, versión 2.0 , artículo 408 da una tasa de falsos errores de $3.8\cdot 10^{-7}$ para $n=128$ . El segundo refrendo [AIS31V1] Una propuesta para: Clases de funcionalidad y metodología de evaluación para generadores de números aleatorios verdaderos (físicos), versión 3.1 En el ejemplo E.6, se obtiene la misma tasa de errores falsos para $n=80$ . Tanto mi intento de cálculo exacto como la simulación de Monte-Carlo sugieren que el valor de la tasa de error falso es correcto sólo en [AIS31V1], y la justificación dada (aproximación por el $\chi^2$ lo que daría una tasa de falsos errores de $3.4\cdot 10^{-8}$ ) inutilizable para obtener el valor correcto.
Por lo tanto, pregunto cómo derivar directamente la tasa de error falso para esta prueba, preferiblemente con una referencia autorizada; entonces, con la esperanza de explicar una tasa de error mucho más alta observada en la práctica, el efecto esperado en la tasa de error falso de un ligero sesgo en los bits de origen (por ejemplo, si los bits se suponen independientes con media $0.5+\epsilon$ ).
Actualización: Entiendo por qué la aproximación por un $\chi^2$ no funciona; cómo puedo hacer simulaciones de Monte-Carlo; y cómo en principio puedo calcular exactamente las probabilidades de que la prueba falle (para $\epsilon=0$ mi código C que cuenta las probabilidades exactas de cada valor posible del resultado de la prueba es utilizable para $n$ múltiplo de $16$ hasta $160$ (con resultados que no se contradicen con las simulaciones). Los problemas son que me gustaría tener referencias; y este enfoque exacto choca con un muro computacional para $\epsilon\ne0$ .
Esto muestra mis resultados provisionales para la tasa de falsos errores (para $\epsilon=0$ ) en función del umbral, para diferentes $n$ y por el $\chi^2$ aproximación de la distribución.