Cuando se trata de un experimento real, el número n de dardos aterrizados en el cuadrado siempre será finito y, por tanto, los teoremas límite no serán directamente aplicables. No se puede garantizar el tamaño del error, pero se puede encontrar una cantidad suficientemente grande n para que la probabilidad de un pequeño error sea alta. Por tanto, la probabilidad de obtener una buena estimación depende totalmente del tamaño deseado del error y del número n . No puede ser del 100%, ya que todos los n los dardos pueden fallar, dando una mala estimación para cualquier tamaño de error elegido menor que él mismo.
Boson señaló que, dado que los dardos se lanzan aleatoriamente a la plaza y no se dirigen a ningún lugar en particular, su posición se distribuiría uniformemente y, por tanto, el número de dardos $m$ que golpean el círculo se distribuiría binomialmente con probabilidad de éxito $p=\frac{}{4}$ (y $n$ número de experimentos). Ya que se busca obtener pequeños errores y se necesitará lanzar muchos dardos, $\quad\mathrm{Bi}(n,p)\ni m\;\approx\; m\in\mathrm{N}(np,\sqrt{np(1-p)}),\quad p=\frac{\pi}{4}$ .
Entonces para el error total de la estimación tenemos $\quad\mathrm{err}(m,n,p)=4\frac{m}{n}-4p\in \mathrm{N}(0,4\sqrt{\frac{p(1-p)}{n}})$ ,
que es lo mismo que implica el teorema central del límite porque $\frac{m}{n}$ es efectivamente la media de $n$ variables de la distribución Bernoulli con probabilidad $p$ .
Así que con grandes $n$ podemos reducir la varianza del error, haciendo que la probabilidad de un gran error sea menor. En particular, si hacemos no conocer el valor de $\pi$ (y $p$ ) de antemano, debemos tener en cuenta que $\underset{0<p<1}{\mathrm{max}}\sqrt{p(1-p)}=\sqrt{{\frac{1}{2}(1-\frac{1}{2})}}=\frac{1}{2}$ y por lo tanto la mayor varianza que podemos tener es $\frac{2}{\sqrt{n}}$ . Entonces, para cada $c>0$ y $0<\alpha<1$ podemos calcular $n$ para que $\mathrm{P}(|\mathrm{err}(n)|\leq c)\geq \alpha\,,\quad\mathrm{err}(n)\in\mathrm{N}(0,\frac{2}{\sqrt{n}})$ .
En concreto, para que el error sea inferior a 0,0001 con una probabilidad superior al 94,7%, se necesitan 1.500 millones de dardos que den en la casilla. Si se llega a los 3.000 millones, hay más de un 99,3% de probabilidad de obtener una buena estimación. Llegados a este punto, puede ser más probable acertar el real que obtener un error significativamente grande (broma). Sin embargo, estas cifras son realmente exageradas, ya que darían una buena estimación si el real fuera cualquier número entre 0 y 4. Si, por ejemplo, sabemos además $\pi>3$ , entonces podemos tomar $p=\frac{\pi}{4}>\frac{3}{4}$ y tendremos $\mathrm{Var}(\mathrm{err})<\frac{\sqrt3}{\sqrt{n}}<\frac{2}{\sqrt{n}}$ por lo que necesitaremos un $n$ para el mismo $c$ y $\alpha$ . Para una probabilidad superior al 94,4% el error es inferior a 0,0001, sabiendo >3, sólo necesitamos 1.100 millones de dardos, lo que sólo nos haría estar seguros de que la estimación es buena en menos de un 90,3% si no supiéramos que 3<<4.
Es interesante notar que si comenzamos la prueba, pensando falsamente =2, necesitaríamos lanzar un montón de dardos antes de notar seguramente que el error no es pequeño en absoluto, lo que nos indica el valor real de . Pero si decidimos =0 o =4 para que el error tenga una varianza 0, entonces teóricamente sólo necesitamos 1 dardo para encontrar . ¡Una vez realizados estos cálculos, después de lanzar un dardo y acertar el círculo concluimos =4 o si fallamos el círculo decimos =0. Esto demuestra que la prueba está construida de tal manera que si asumimos falsamente un valor erróneo de podemos ser llevados a aceptarlo después de no lanzar suficientes dardos para demostrar lo contrario! Afortunadamente, como lo real está lejos de 0 y 4, si hacemos las suposiciones correctas o no hacemos ninguna, un buen número de dardos seguro que dará una buena estimación.
Mirándolo desde un punto de vista estadístico, por cada $m$ dardos en el círculo de $n$ tiro en la plaza e hipótesis $\;H_c:\pi=c\,,0\leq c\leq4$ , puede encontrar el $\text{p-value}(m,n,c)=$
$=2\,\mathrm{min}\{\mathrm{P}(z\leq\mathrm{err})\,,\,\mathrm{P}(z\geq\mathrm{err})\quad|\quad p=\frac{c}{4}\enspace,\enspace z\in\mathrm{N}(0,4\sqrt{\frac{p(1-p)}{n}})\}$ es decir $\text{p-value}(m,n,c)$ es la probabilidad de observar un error mayor que el error del $m$ y $n$ si $\pi=c$ . Entonces, cada vez que lanzas $n$ dardos en la plaza y $m$ aterrizar en el círculo, $\hat c$ que satisface $\text{p-value}(m,n,\hat c)=\underset{0\leq c\leq4}{\mathrm{max}}\{\text{p-value}(m,n,c)\}$ es ese valor para $\pi$ para el que la prueba de hipótesis para que el valor esperado del error sea 0 pasaría al máximo nivel de significación, es decir $\hat c$ es tal que si $\pi=\hat c$ entonces la probabilidad de observar un error mayor que el observado en el experimento es la más alta en comparación con todos los demás valores posibles de $\pi$ y por lo tanto la probabilidad de observar un error menor que el observado es la más baja, haciendo $\hat c$ el valor más probable para $\pi$ considerando que tenemos exactamente $m$ dardos en el círculo de $n$ en la plaza. Por supuesto, esto sólo tendrá buenos resultados para un tamaño suficientemente grande $n$ .
0 votos
Creo que necesitas usar el $\chi^2$ distribución. Para tener un 95% de posibilidades de estar en el rango, se necesita algo del orden de $10^8$ tiempos.
0 votos
Así es. ¿Pero qué pasa con el 5%? ¿Cómo puedo concederlo usando el $\chi^2$ o la prueba del valor p, la "cola" del 5% ignorada no es relevante?
0 votos
Siempre hay algo de incertidumbre. Siempre puedes aumentar al 99% o al 99,9% si quieres estar más seguro.
0 votos
¿Puedo cuantificar hasta qué punto estoy "más seguro"? Esos "99%" o "99,999%", en mi humilde opinión, no son una buena medida de certeza, porque no se sabe la relevancia del 0,001% restante que podría afectar a la media de los resultados de forma significativa.
0 votos
Necesitas usar el Teorema Central del Límite. Todos sus lanzamientos son RV de Bernuilli con $p=\pi/4$ . Por lo tanto, $4\frac m n -\pi\sim N(0,\sqrt {\frac {p(1-p)}n})$ . También sabe que $|4\frac m n-\pi|\le\pi$ y es la mejor garantía determinista que puedes tener ya que todos los lanzamientos pueden fallar.
0 votos
Suponiendo que no conozca el valor de $\pi$ antes y quiero medirlo no puedo usar $\pi$ para estimar el número de lanzamientos necesarios para aproximar $\pi$ . Lo que podría hacer es decir: $0\leq \pi \leq 4$ . $p(1-p)=\frac{3 \pi^2}{4}$ . No sé el valor de $\pi$ Así que el peor escenario es $\pi=4$ . Utilizo el sistema normal de $N(0,\sqrt{\frac{3*4^2}{4n}})=N(0,\sqrt{\frac{12}{n} })$ . Aumento $n$ hasta el $95$ del área de esa normal está en el intervalo $(-0.0001,0.0001)$ . ¿Podría ser esta una solución?
0 votos
Usted no sabe absolutamente nada sobre $\pi$ aparte de eso $\pi\le 4$ , entonces puede utilizar $p(1-p)\le \frac 1 4$ (el peor escenario (la mayor varianza) es $\pi=2$ . no $\pi=4$ ). Pero se puede limitar fácilmente $\pi$ desde abajo y mejorar el límite de $p(1-p)$ desde arriba.