He muestreado un proceso del mundo real, los tiempos de ping de la red. El "tiempo de ida y vuelta" se mide en milisegundos. Los resultados se representan en un histograma:
Los tiempos de ping tienen un valor mínimo, pero una larga cola superior.
Quiero saber de qué distribución estadística se trata y cómo estimar sus parámetros.
Aunque la distribución no es una distribución normal, todavía puedo mostrar lo que estoy tratando de lograr.
La distribución normal utiliza la función
con los dos parámetros
- μ (media)
- σ 2 (variante)
Estimación de parámetros
Las fórmulas para estimar los dos parámetros son:
Aplicando estas fórmulas contra los datos que tengo en Excel, obtengo:
- μ = 10,9558 (media)
- σ 2 \= 67,4578 (varianza)
Con estos parámetros puedo trazar el " normal " sobre mis datos muestreados:
Obviamente no es una distribución normal. Una distribución normal tiene una cola superior e inferior infinitas, y es simétrica. Esta distribución no es simétrica.
¿Qué principios aplicaría, qué diagrama de flujo, para determinar de qué tipo de distribución se trata?
Y para ir al grano, ¿cuál es la fórmula de esa distribución y cuáles son las fórmulas para estimar sus parámetros?
Quiero obtener la distribución para poder obtener el valor "medio", así como la "dispersión":
En realidad estoy trazando el histrograma en el software, y quiero superponer la distribución teórica:
Etiquetas: muestreo, estadística, estimación de parámetros, distribución normal
2 votos
Por curiosidad, ¿has probado a hacer esta pregunta en stats.stackexchange.com ? (Creo que tu pregunta es apropiada aquí también, pero puede que obtengas más/diferentes respuestas allí).
0 votos
Voy a copiarlo allí; yo y mi 1 representante.
0 votos
Tengo entendido que hay una grande La literatura sobre cosas como los tiempos de ping de la red y la respuesta está probablemente en un documento en alguna parte.
2 votos
¿Ha intentado utilizar ccsl.mae.cornell.edu/eureqa ?
0 votos
Enlace a la pregunta en stats.stackexchange .
0 votos
@jug Eureqa parecía una gran herramienta. Pero lo mejor es
f(x) = 1.000
yf(y) = y
0 votos
¿Podría alguien quitar la etiqueta de matemáticas discretas? Esto es claramente estadística, no es lo que yo asocio con las matemáticas discretas.