8 votos

¿Traducción matemática precisa de la regla 68-95-99.7? (¡No es una prueba!)

La regla:

En estadística, la regla 68-95-99.7, también conocida como la regla de los tres dígitos o regla empírica, establece que casi todos los valores se encuentran dentro de 3 desviaciones estándar de la media en una distribución normal.

Alrededor del 68,27% de los valores se encuentran dentro de una desviación estándar de la media. Del mismo modo, alrededor del 95,45% de los valores se encuentran dentro de 2 desviaciones estándar de la media. Casi todos (99,73%) los valores se encuentran dentro de 3 desviaciones estándar de la media.


Así que supongamos que tengo un conjunto de valores (medidas) que tiene la propiedad de distribución normal. Llamémoslo S.

Cuando dicen "alrededor del 68,27% de los valores", ¿qué valores significan? ¿Significan que la desviación estándar de cualquier 68,27% de los elementos de S es menor que 1? ¿Significan algo más? ¿Podría alguien darme una afirmación matemática precisa que sea equivalente a esta "regla del 68-95-99,7".

He publicado esto en math.stackexchange porque me gustaría tener una respuesta matemática.

0 votos

11voto

awkward Puntos 1740

El enunciado matemático de la regla "dentro de una desviación estándar" es que

$$\Pr(\mu-\sigma < X < \mu + \sigma) =\frac{1}{\sqrt{2 \pi} \sigma} \int_{\mu - \sigma}^{\mu + \sigma} \exp \left( - \frac{(x-\mu)^2}{2 \sigma^2} \right) \; dx = \frac{1}{\sqrt{2 \pi}} \int_{-1}^1 \exp \left( - \frac{u^2}{2} \right) \; du \approx 0.682689$$

(En la integral, basta con hacer la sustitución $u = (x-\mu)/\sigma)$ .)

¿Es eso lo que tenías en mente? Las otras afirmaciones son similares, sólo que sustituyendo $\sigma$ con $2 \sigma$ o $3 \sigma$ .

5voto

Tony Wong Puntos 1507

Precisamente, significan que si se pudiera observar un número "infinito" de valores de su distribución normal, el 68% estaría dentro de una desviación estándar de la media, tal y como especifican los parámetros de su distribución, el 95% estaría dentro de dos desviaciones estándar y el 99,7% dentro de tres desviaciones estándar.

Por supuesto, no se puede tomar un número infinito de observaciones. Pero cuanto mayor sea el número finito de observaciones que puede tomar, más cerca estarán sus resultados del caso infinito. Si sólo tomas un número muy reducido de observaciones, los resultados podrían ser muy diferentes del ideal por el que preguntas. Pero si tienes cientos de observaciones, estarás sorprendentemente cerca. Éste es el contenido de la Ley de los Grandes Números.

0 votos

Qué porcentaje de puntos están en el intervalo $(0,0.68)$ en comparación con el intervalo $(0,1)$ ? ¡Ambos son infinitos!

1 votos

Lo dicho: el intervalo $(0,0.68)$ tiene $68%$ de los puntos del intervalo $(0,1)$ . Hay otros, pero este es uno obvio. $(0.17,0.83)$ también tiene el 68% de los puntos de $(0,1)$ . En este caso, para la distribución uniforme en $(0,1)$ , longitud trabaja para definir los porcentajes. En general, es necesario utilizar una probabilidad medir de la que la longitud en una distribución uniforme es un caso especial.

0 votos

Ok, gracias por las respuestas pero ¿cuál sería la respuesta para esta pregunta "quieren decir que la desviación estándar de cualquier 68,27 % de los elementos de S es menor que 1?"? Todavía no he leído teoría de la probabilidad, así que cosas como "distribuciones uniformes" son desconocidas para mí.

4voto

Oli Puntos 89

Si $X$ es una variable aleatoria normalmente distribuida, entonces $$\Pr\left(\left|\frac{X-\mu}{\sigma}\right|\le 1\right)\approx 0.6826.$$ Aquí $\mu$ es la media de la población, y $\sigma$ es la desviación estándar de la población.

Hechos similares son válidos para los otros dos números que has mencionado.

Si hacemos repeticiones independiente muestreo, que puede representarse como una secuencia $X_1,X_2,X_3,\dots, X_n$ de variables aleatorias independientes con la misma media y varianza. Si $n$ es grande, entonces con una probabilidad razonable el proporción de los resultados de la muestra que se encuentra entre $\mu-\sigma$ y $\mu+\sigma$ no estará lejos de $68\%$ . Sin embargo, incluso con $n$ alrededor de $1000$ , sólo podemos estar sobre $95\%$ seguro de que la proporción experimental estará entre $65\%$ y $71\%$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X