Voy a responder a su punto acerca de las simulaciones con " R " porque este es el único con el que estoy familiarizado. R tiene un montón de builtin distribuciones que puede simular. La lógica de la nomenclatura es que para simular una distribución llamada dis
será el nombre rdis
.
A continuación son los que yo uso más a menudo
# Some continuous distributions.
?rnorm
?runif
?rgamma
?rlnorm
?rweibull
?rexp
?rt
# Some discrete distributions.
?rpoiss
?rbinom
?rnbinom
?rgeom
?rhyper
Usted puede encontrar algunos de los complementos en el Ajuste de distribuciones con R.
Además: gracias a @jthetzel para proporcionar un enlace con una lista completa de las distribuciones y los paquetes que pertenecen.
Pero espere, aún hay más: OK, seguir a @whuber comentario que voy a tratar de los otros puntos. Respecto del punto 1, yo nunca ir por una bondad de ajuste de enfoque. En lugar de eso, siempre pienso en el origen de la señal, al igual que lo hace el fenómeno, hay algunas natural simetrías en lo que lo produce , etc. Necesita varios capítulos del libro para cubrirlo, así que voy a dar dos ejemplos.
Si los datos de la cuenta y no hay ningún límite superior, yo trate de una distribución de Poisson. Poisson variables puede ser interpretado como la cuenta de los sucesivos independientes durante una ventana de tiempo, que es un marco muy general. I ajuste de la distribución y la ver (a menudo visualmente) si la varianza es bien descrito. Muy a menudo, la varianza de la muestra es mucho mayor, en cuyo caso yo uso una Binomial Negativa. Binomial negativa puede ser interpretado como una mezcla de Poisson con diferentes variables, lo que es aún más general, por lo que este generalmente se ajusta muy bien a la muestra.
Si creo que los datos es simétrica alrededor de la media, es decir, que las desviaciones son las mismas probabilidades de ser positivo o negativo, yo trate de un ajuste Gaussiano. Yo, a continuación, comprobar (una vez más visualmente) si hay una gran cantidad de valores atípicos, yo.e puntos de datos muy lejos de la media. Si hay, yo uso una de la t de Student en su lugar. La t de Student la distribución puede ser interpretado como una mezcla de Gaussianas con diferentes variaciones, que es de nuevo muy general.
En esos ejemplos, cuando digo visualmente, me refiero a que yo uso una Q-Q plot
El punto 3, también merece varios capítulos del libro. Los efectos de usar una distribución en lugar de otro son ilimitadas. Así que en lugar de ir a través de todo, voy a seguir los dos ejemplos anteriores.
En mis primeros días, yo no sabía que Binomial Negativa puede tener una interpretación significativa por lo que he usado de Poisson todo el tiempo (porque me gusta ser capaz de interpretar los parámetros en términos humanos). Muy a menudo, cuando se utiliza una distribución de Poisson, que encaja en el decir muy bien, pero subestima la varianza. Esto significa que usted no puede reproducir los valores extremos de la muestra y se tendrá en cuenta valores como los valores atípicos (puntos de datos que no tienen la misma distribución que el resto de los puntos), mientras que en realidad no son.
De nuevo en mis primeros días, yo no sabía que los de la t de Student también tiene una interpretación significativa y me gustaría utilizar el Gaussiano todo el tiempo. Algo similar sucedió. Me gustaría ajuste de la media y la varianza bien, pero yo todavía no la captura de los valores atípicos debido a que casi todos los puntos de datos se supone que dentro de 3 desviaciones estándar de la media. La misma cosa pasó, llegué a la conclusión de que algunos puntos de la "extraordinaria", aunque en realidad no lo eran.