11 votos

La simulación de distribuciones

Estoy trabajando en una Planificación de la Capacidad de asignación y he leído algunos libros. Esto es específicamente acerca de las distribuciones. Yo uso R.

  1. ¿Cuál es el enfoque recomendado para identificar lo que mi distribución de los datos es ? Tengo este diagrama, pero existen métodos estadísticos para identificar ?

    PROBABILISTIC APPROACHES: SCENARIO ANALYSIS, DECISION TREES AND SIMULATIONS

  2. ¿Cuáles son las simulaciones de los enfoques disponibles con R ? Aquí quiero para generar los datos de una cierta distribución como exponencial. Es el r-java el enfoque correcto si quiero integrar con Java ?

  3. Hay una manera de predecir lo que la distribución del efecto( uso de CPU, etc. ) al tubo de datos de una distribución particular ? ¿Cuáles son los diferentes efectos de envío de ciertas distribuciones de datos ?

Por favor, considere estas como principiante preguntas. Hay libros o material que lidiar con estos tipos de simulaciones ?

Notas

El diagrama es desde el extremo del papel http://people.stern.nyu.edu/adamodar/pdfiles/papers/probabilistic.pdf.

La bondad de ajuste de las técnicas que se han llegado a través de

Evaluación de la bondad de ajuste de

  1. Chi-cuadrado
  2. Prueba De Kolmogorov-Smirnov,
  3. Anderson-Darling estadísticas de densidad, cdf, P-P y Q-Q parcelas

No estoy seguro de cuál es la interpretación o próximos pasos si veo que mi distribución es normal o exponencial, etc. ¿Qué me permite hacer? Predicción? Espero que esta pregunta es clara.

Exponencial de los retrasos inducir la cola fluctuatuions como por mi Capacidad de Planificación libro de Neil Gunther. Así que yo sé que un punto.

7voto

JMW.APRN Puntos 21

Voy a responder a su punto acerca de las simulaciones con " R " porque este es el único con el que estoy familiarizado. R tiene un montón de builtin distribuciones que puede simular. La lógica de la nomenclatura es que para simular una distribución llamada dis será el nombre rdis.

A continuación son los que yo uso más a menudo

# Some continuous distributions.
?rnorm
?runif
?rgamma
?rlnorm
?rweibull
?rexp
?rt
# Some discrete distributions.
?rpoiss
?rbinom
?rnbinom
?rgeom
?rhyper

Usted puede encontrar algunos de los complementos en el Ajuste de distribuciones con R.

Además: gracias a @jthetzel para proporcionar un enlace con una lista completa de las distribuciones y los paquetes que pertenecen.

Pero espere, aún hay más: OK, seguir a @whuber comentario que voy a tratar de los otros puntos. Respecto del punto 1, yo nunca ir por una bondad de ajuste de enfoque. En lugar de eso, siempre pienso en el origen de la señal, al igual que lo hace el fenómeno, hay algunas natural simetrías en lo que lo produce , etc. Necesita varios capítulos del libro para cubrirlo, así que voy a dar dos ejemplos.

  1. Si los datos de la cuenta y no hay ningún límite superior, yo trate de una distribución de Poisson. Poisson variables puede ser interpretado como la cuenta de los sucesivos independientes durante una ventana de tiempo, que es un marco muy general. I ajuste de la distribución y la ver (a menudo visualmente) si la varianza es bien descrito. Muy a menudo, la varianza de la muestra es mucho mayor, en cuyo caso yo uso una Binomial Negativa. Binomial negativa puede ser interpretado como una mezcla de Poisson con diferentes variables, lo que es aún más general, por lo que este generalmente se ajusta muy bien a la muestra.

  2. Si creo que los datos es simétrica alrededor de la media, es decir, que las desviaciones son las mismas probabilidades de ser positivo o negativo, yo trate de un ajuste Gaussiano. Yo, a continuación, comprobar (una vez más visualmente) si hay una gran cantidad de valores atípicos, yo.e puntos de datos muy lejos de la media. Si hay, yo uso una de la t de Student en su lugar. La t de Student la distribución puede ser interpretado como una mezcla de Gaussianas con diferentes variaciones, que es de nuevo muy general.

En esos ejemplos, cuando digo visualmente, me refiero a que yo uso una Q-Q plot

El punto 3, también merece varios capítulos del libro. Los efectos de usar una distribución en lugar de otro son ilimitadas. Así que en lugar de ir a través de todo, voy a seguir los dos ejemplos anteriores.

  1. En mis primeros días, yo no sabía que Binomial Negativa puede tener una interpretación significativa por lo que he usado de Poisson todo el tiempo (porque me gusta ser capaz de interpretar los parámetros en términos humanos). Muy a menudo, cuando se utiliza una distribución de Poisson, que encaja en el decir muy bien, pero subestima la varianza. Esto significa que usted no puede reproducir los valores extremos de la muestra y se tendrá en cuenta valores como los valores atípicos (puntos de datos que no tienen la misma distribución que el resto de los puntos), mientras que en realidad no son.

  2. De nuevo en mis primeros días, yo no sabía que los de la t de Student también tiene una interpretación significativa y me gustaría utilizar el Gaussiano todo el tiempo. Algo similar sucedió. Me gustaría ajuste de la media y la varianza bien, pero yo todavía no la captura de los valores atípicos debido a que casi todos los puntos de datos se supone que dentro de 3 desviaciones estándar de la media. La misma cosa pasó, llegué a la conclusión de que algunos puntos de la "extraordinaria", aunque en realidad no lo eran.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X