Continuando con mi pregunta anterior Estoy tratando de analizar los datos cualitativamente.
En el siguiente gráfico, hago $10000$ muestras donde cuento "el número de choques". Trazo $n$ frente al número de veces $n$ se produjeron enfrentamientos.
(El número de enfrentamientos es una medida de "cómo de erróneo" fue un intento de ataque [en el esquema de reparto de secretos que estoy viendo]).
(Dibujado con tikzDevice para R y luego se edita manualmente).
En R, falla el shapiro.test
, por lo que no se distribuye normalmente:
> shapiro.test(z[1:5000])
Shapiro-Wilk normality test
data: z[1:5000]
W = 0.9947, p-value = 1.597e-12
Así que:
P: ¿Cómo puedo estimar la probabilidad $p$ de $0$ ¿contratiempos de la distribución anterior?
Debe ser muy pequeño, alrededor de $10^{-14}$ :
- Tengo un límite inferior teórico de $1.046 \times 10^{-14}$ y espero que se acerque al valor real.
- He hecho $10^{11}$ muestras, y todos tenían al menos un choque.
He intentado ajustar una curva exponencial al lado izquierdo (dibujado arriba): la curva es $$3.29 \times 10^{-12} \exp(0.56n)$$ que, cuando $n=0$ da la estimación $\hat{p}=3.29 \times 10^{-16}$ . Pero sé que esta estimación está fuera de lugar por un factor de $100$ Lo que me hace pensar que este no es el mejor enfoque. (O tal vez debería ajustar alguna otra curva, o utilizar más muestras. O tal vez este nivel de confianza es de esperar).
Apéndice :
-
Estoy tratando de mostrar que $\mathrm{Pr}[0 \text{ clashes}]$ es pequeño (por ejemplo, menos de $10^{-8}$ o $10^{-9}$ ). Así que la estimación no tiene que ser precisa, pero necesito tener confianza en ella.
-
El número máximo teórico de enfrentamientos es $220$ (esta cifra puede alcanzarse).
-
"¿Conoce la potencia estadística de la prueba de Shapiro-Wilk para un tamaño de muestra tan grande?" En resumen, no, no lo sé. Pero podemos comparar los resultados con datos aleatorios de una distribución normal:
> shapiro.test(rnorm(5000, mean = mean(z), sd = sd(z))) Shapiro-Wilk normality test data: rnorm(5000, mean = mean(z), sd = sd(z)) W = 0.9996, p-value = 0.4053
Si bien los resultados fluctúan entre las ejecuciones, no parecen comparables a mis datos.
También probé con menos muestras incluidas y no pareció "ayudar".
> shapiro.test(z[1:100]) Shapiro-Wilk normality test data: z[1:100] W = 0.9757, p-value = 0.06116
en comparación con
> shapiro.test(rnorm(100, mean = mean(z), sd = sd(z))) Shapiro-Wilk normality test data: rnorm(100, mean = mean(z), sd = sd(z)) W = 0.9845, p-value = 0.2932
(Aquí, fluctúa bastante).
-
Soy capaz de hacer alrededor de $10^{10}$ muestras, por si sirve de algo.