6 votos

Medición de $\pi$ lanzando dardos

Quiero dar una aproximación de $\pi$ de esta manera: Inscribo un círculo en un cuadrado y luego lanzo dardos al azar sobre el cuadrado desde lejos. Si los dardos que caen en el cuadrado son $n$ y los dardos que caen en el círculo son $m<n$ I aproximado $\pi$ con $4 \frac{m}{n}$ .

Supongamos que quiero una aproximación tal que $|4\frac{m}{n}-\pi|<0,0001$ .

¿Cómo puedo cuantificar cuántos disparos tengo que hacer al menos (antes de hacer el experimento)?

Sé que la ley de los grandes números me dice que $P(\lim_{n\to\infty} 4\frac{m}{n}=\pi)=1$ Pero no puedo hacer un número infinito de disparos, así que lo intento con la ley débil: $\lim_{n\to\infty}P(|4\frac{m}{n}-\pi|<0,0001)=1$ . Una vez más, esto parece ser poco útil para mi causa.

Tal vez podría tomar el compromiso de que quiero una aproximación tal que $|4\frac{m}{n}-\pi|<0,0001$ con una probabilidad superior a $0,95$ pero aunque consiga este objetivo, nada me asegura que en $5\%$ de los casos, la aproximación obtenida es tal que $|4\frac{m}{n}-\pi|>3$ .

¿Cuál sería su enfoque de este problema?

0 votos

Creo que necesitas usar el $\chi^2$ distribución. Para tener un 95% de posibilidades de estar en el rango, se necesita algo del orden de $10^8$ tiempos.

0 votos

Así es. ¿Pero qué pasa con el 5%? ¿Cómo puedo concederlo usando el $\chi^2$ o la prueba del valor p, la "cola" del 5% ignorada no es relevante?

0 votos

Siempre hay algo de incertidumbre. Siempre puedes aumentar al 99% o al 99,9% si quieres estar más seguro.

1voto

conradg Puntos 21

Supongo que los disparos de dardos son independientes. Entonces, cada dardo cae dentro del círculo con probabilidad $\frac{\pi}{4}$ .
La probabilidad de que el variable aleatoria $m$ toma valor $k$ después de $n$ disparos es $P(m(n) = k) = \binom{n}{k} (\frac{\pi}{4})^k (1 - \frac{\pi}{4})^{n-k}$ .

Ahora la probabilidad de que $4 \frac{m}{n} \leq \pi + \varepsilon$ es la misma que la probabilidad de que $m \leq \lfloor \frac{n(\pi + \varepsilon)}{4} \rfloor$ . Simétricamente, la probabilidad de que $4 \frac{m}{n} \geq \pi - \varepsilon$ es la misma que la probabilidad de que $m \geq \lceil \frac{n(\pi - \varepsilon)}{4} \rceil$ . Así, la probabilidad de tener $|4\frac{m}{n} - \pi| \leq \varepsilon$ está dada por:
$Q(n) = P(|4\frac{m}{n} - \pi|) = \sum_{k = \lceil \frac{n(\pi - \varepsilon)}{4} \rceil}^{\lfloor \frac{n(\pi + \varepsilon)}{4} \rfloor} \binom{n}{k} (\frac{\pi}{4})^k (1 - \frac{\pi}{4})^{n-k}$ .

No se puede estar seguro de obtener la precisión deseada después de $n$ disparos, pero siempre se puede calcular $n$ para que $Q(n) \geq 1-\eta$ para cualquier $\eta$ que consideres aceptable. Esto le dará una estimación de $n$ .

1voto

GGoranov Puntos 61

Cuando se trata de un experimento real, el número n de dardos aterrizados en el cuadrado siempre será finito y, por tanto, los teoremas límite no serán directamente aplicables. No se puede garantizar el tamaño del error, pero se puede encontrar una cantidad suficientemente grande n para que la probabilidad de un pequeño error sea alta. Por tanto, la probabilidad de obtener una buena estimación depende totalmente del tamaño deseado del error y del número n . No puede ser del 100%, ya que todos los n los dardos pueden fallar, dando una mala estimación para cualquier tamaño de error elegido menor que él mismo.

Boson señaló que, dado que los dardos se lanzan aleatoriamente a la plaza y no se dirigen a ningún lugar en particular, su posición se distribuiría uniformemente y, por tanto, el número de dardos $m$ que golpean el círculo se distribuiría binomialmente con probabilidad de éxito $p=\frac{}{4}$ (y $n$ número de experimentos). Ya que se busca obtener pequeños errores y se necesitará lanzar muchos dardos, $\quad\mathrm{Bi}(n,p)\ni m\;\approx\; m\in\mathrm{N}(np,\sqrt{np(1-p)}),\quad p=\frac{\pi}{4}$ .
Entonces para el error total de la estimación tenemos $\quad\mathrm{err}(m,n,p)=4\frac{m}{n}-4p\in \mathrm{N}(0,4\sqrt{\frac{p(1-p)}{n}})$ ,
que es lo mismo que implica el teorema central del límite porque $\frac{m}{n}$ es efectivamente la media de $n$ variables de la distribución Bernoulli con probabilidad $p$ .

Así que con grandes $n$ podemos reducir la varianza del error, haciendo que la probabilidad de un gran error sea menor. En particular, si hacemos no conocer el valor de $\pi$ (y $p$ ) de antemano, debemos tener en cuenta que $\underset{0<p<1}{\mathrm{max}}\sqrt{p(1-p)}=\sqrt{{\frac{1}{2}(1-\frac{1}{2})}}=\frac{1}{2}$ y por lo tanto la mayor varianza que podemos tener es $\frac{2}{\sqrt{n}}$ . Entonces, para cada $c>0$ y $0<\alpha<1$ podemos calcular $n$ para que $\mathrm{P}(|\mathrm{err}(n)|\leq c)\geq \alpha\,,\quad\mathrm{err}(n)\in\mathrm{N}(0,\frac{2}{\sqrt{n}})$ .

En concreto, para que el error sea inferior a 0,0001 con una probabilidad superior al 94,7%, se necesitan 1.500 millones de dardos que den en la casilla. Si se llega a los 3.000 millones, hay más de un 99,3% de probabilidad de obtener una buena estimación. Llegados a este punto, puede ser más probable acertar el real que obtener un error significativamente grande (broma). Sin embargo, estas cifras son realmente exageradas, ya que darían una buena estimación si el real fuera cualquier número entre 0 y 4. Si, por ejemplo, sabemos además $\pi>3$ , entonces podemos tomar $p=\frac{\pi}{4}>\frac{3}{4}$ y tendremos $\mathrm{Var}(\mathrm{err})<\frac{\sqrt3}{\sqrt{n}}<\frac{2}{\sqrt{n}}$ por lo que necesitaremos un $n$ para el mismo $c$ y $\alpha$ . Para una probabilidad superior al 94,4% el error es inferior a 0,0001, sabiendo >3, sólo necesitamos 1.100 millones de dardos, lo que sólo nos haría estar seguros de que la estimación es buena en menos de un 90,3% si no supiéramos que 3<<4.

Es interesante notar que si comenzamos la prueba, pensando falsamente =2, necesitaríamos lanzar un montón de dardos antes de notar seguramente que el error no es pequeño en absoluto, lo que nos indica el valor real de . Pero si decidimos =0 o =4 para que el error tenga una varianza 0, entonces teóricamente sólo necesitamos 1 dardo para encontrar . ¡Una vez realizados estos cálculos, después de lanzar un dardo y acertar el círculo concluimos =4 o si fallamos el círculo decimos =0. Esto demuestra que la prueba está construida de tal manera que si asumimos falsamente un valor erróneo de podemos ser llevados a aceptarlo después de no lanzar suficientes dardos para demostrar lo contrario! Afortunadamente, como lo real está lejos de 0 y 4, si hacemos las suposiciones correctas o no hacemos ninguna, un buen número de dardos seguro que dará una buena estimación.

Mirándolo desde un punto de vista estadístico, por cada $m$ dardos en el círculo de $n$ tiro en la plaza e hipótesis $\;H_c:\pi=c\,,0\leq c\leq4$ , puede encontrar el $\text{p-value}(m,n,c)=$
$=2\,\mathrm{min}\{\mathrm{P}(z\leq\mathrm{err})\,,\,\mathrm{P}(z\geq\mathrm{err})\quad|\quad p=\frac{c}{4}\enspace,\enspace z\in\mathrm{N}(0,4\sqrt{\frac{p(1-p)}{n}})\}$ es decir $\text{p-value}(m,n,c)$ es la probabilidad de observar un error mayor que el error del $m$ y $n$ si $\pi=c$ . Entonces, cada vez que lanzas $n$ dardos en la plaza y $m$ aterrizar en el círculo, $\hat c$ que satisface $\text{p-value}(m,n,\hat c)=\underset{0\leq c\leq4}{\mathrm{max}}\{\text{p-value}(m,n,c)\}$ es ese valor para $\pi$ para el que la prueba de hipótesis para que el valor esperado del error sea 0 pasaría al máximo nivel de significación, es decir $\hat c$ es tal que si $\pi=\hat c$ entonces la probabilidad de observar un error mayor que el observado en el experimento es la más alta en comparación con todos los demás valores posibles de $\pi$ y por lo tanto la probabilidad de observar un error menor que el observado es la más baja, haciendo $\hat c$ el valor más probable para $\pi$ considerando que tenemos exactamente $m$ dardos en el círculo de $n$ en la plaza. Por supuesto, esto sólo tendrá buenos resultados para un tamaño suficientemente grande $n$ .

0 votos

Y además en su estimación de lo normal utiliza el valor real de $\pi$ pero si el experimento es "honesto" no se sabe el valor de $\pi$ por lo que hay que utilizar el "peor de los casos" de $\pi=4$ ¡en lo normal!

0 votos

¡@Benzio tu comentario me hizo pensar y tienes razón! ¡Sólo que en realidad el peor escenario es cuando la varianza del error es mayor, que es cuando p(1-p) es mayor a =2! He editado mi respuesta con algunas consideraciones más y datos numéricos y he borrado mi otro comentario que era falso ya que efectivamente se puede averiguar cuántos dardos se necesitan para una buena estimación muy probable siempre que no se hagan suposiciones muy equivocadas sobre el valor real de :) Espero haber conseguido responder a tu pregunta esta vez y comenta más si no estás de acuerdo en algo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X