5 votos

Encontrar la desviación estándar de una distribución de probabilidad.

Aquí está la pregunta:

El tiempo, al minuto entero más cercano, que un autobús de la ciudad para ir de un extremo de su ruta para que el otro tiene la distribución de probabilidad que se muestra. Como a veces sucede con las probabilidades calculadas como empírica de frecuencias relativas, las probabilidades en la tabla de sumar sólo un valor distinto de $1.00$ debido a errores de redondeo. $$ \begin{array}{c|cccccc} x & 42 & 43 & 44 & 45 & 46 & 47 \\ \hline P(x) & 0.10 & 0.23 & 0.34 & 0.25 & 0.05 & 0.02 \\ \end{array} $$ una. Encontrar el promedio de tiempo que el autobús tarda en coche de la longitud de su recorrido.
b. Encontrar la desviación estándar de la longitud de tiempo que el autobús tarda en coche de la longitud de su recorrido.

(Imagen Original aquí.)

Hice la primera parte y consiguió $E(X)=43.54$, que es la respuesta correcta. Sin embargo, para la segunda parte, yo uso la fórmula $\sigma = \sqrt{(\sum x^{2}P(x))-E(X)^{2}}$ y aproximadamente $4.517$. La respuesta es $1.204$. ¿De dónde me salen mal?

4voto

Jean-Claude Arbaut Puntos 9403

Hay un sucio truco, acostado en la observación ", Como a veces ocurre...".

La varianza es, de hecho, dada por

$$V(X)=\sum_i p_i(x_i-\mu)^2=\sum_i p_ix_i^2-\mu^2$$

Con $\mu=\sum_i p_ix_i$. Y la desviación estándar es la raíz cuadrada de la varianza. Pero esta igualdad sólo se mantiene si $\sum_i p_i=1$.

Entonces, ¿qué pasó? Hacer de nuevo el cálculo con la última probabilidad de ser $0.03$ en lugar de $0.02$, para hacer la suma de las probabilidades a $1$. Ambas fórmulas producir una varianza igual a $1.3499$.

Rehacer el cálculo con el último probabilidad de $0.02$: la primera fórmula genera una variación $1.451084$, la fórmula se obtiene el valor de $20.4084$. Lo que pasa es que los pesos no se suma a $1$.

Observe que la primera fórmula genera una desviación estándar $\sqrt{1.451084}\simeq1.20460948$.

¿Qué sería mejor? Sugiero esto: considerar el $p$ "general" pesos (es decir, no se suma a $1$, ya que no de todos modos) y calcular la media y la varianza en consecuencia. Equivalentemente, reweight por la división de la $p_i$ por la suma. La desviación estándar es, a continuación,$1.127971255$.

Nota: incluso si el maestro está a la espera de que usted utilice ciegamente en la primera fórmula, la correcta aproximación es $1.205$, no $1.204$. Pero ya que existe un sesgo en la media (demasiado bajo por aproximadamente el $0.01\times44$, teniendo en cuenta la falta de "masa" $0.01$ está en algún lugar entre el$42$$47$), por lo tanto también en el resultado final, no te lo recomiendo.

Otra nota: el ejercicio mostró que la primera fórmula es más inmune a errores numéricos (la desviación estándar devuelto es más sensible a cualquier valor que usted podría considerar). Usted siempre debe usar esta fórmula, y no la otra.

4voto

BruceET Puntos 7117

Usted está tratando con un leve inexactitud debido al redondeo. Por definición, la media es $\mu = \sum_{i=1}^5 p_ix_i$ y la varianza es $\sigma^2 = \sum_{i=1}^5p_i(x_i - \mu)^2.$ Por una fórmula, derivado de la definición, $$\sigma^2 = E(X^2) - \mu^2 = \sum_{i=2}^5p_ix_i^2 - \mu^2.$$ Sin embargo, la fórmula es muy sensible a errores de redondeo.

En R, la media puede calcularse como sigue:

p = c(.1,.23,.34,.25,.05,.02); x = 42:47;  mu = sum(p*x);  mu
[1] 43.54

Esto está de acuerdo con lo que has encontrado.

De acuerdo a la definición, la desviación estándar y la varianza son

sum(p*(x - mu)^2)
[1] 1.451084
sg = sqrt(sum(p*(x - mu)^2));  sg
[1] 1.204609

Pero la fórmula (exagerando los errores) da la desviación estándar como

sqrt(sum(p*x^2) - mu^2)
[1] 4.517566

No sé lo que se supone que presentan como la solución a este problema. Sin embargo, para hacer sentido de ella, creo que el curso lógico de acción es ajustar las probabilidades para que se agregue a la 1:

sum(p)
[1] 0.99
p1 = p/sum(p); p1; sum(p1)
[1] 0.10101010 0.23232323 0.34343434 0.25252525 0.05050505 0.02020202  # adj probs
[1] 1                                                                  # sum to 1

A continuación, utilice las probabilidades ajustadas desde el comienzo para llegar a la verdadera media y desviación estándar (donde tanto la definición y fórmula de acuerdo):

mu1 = sum(p1*x); mu1; sqrt(sum(p1*(x - mu1)^2));  sqrt(sum(p1*x^2) - mu1^2)
[1] 43.9798
[1] 1.127971
[1] 1.127971

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X