Estoy de programación de una herramienta web (="soy estadísticas ignoramous que deriva aquí de stackoverflow.com") que permite a los científicos para entrar en las predicciones sobre el 5-número-resumen de las estadísticas de una variable. La entrada se realiza mediante la interfaz de usuario de la metáfora de un box-plot.
Me gustaría para permitir a los científicos visualizar su entrada como un archivo PDF/CDF, pero tengo que seleccionar una distribución subyacente.
- Estoy buscando una distribución que es "tan normal como sea posible", mientras que todavía siendo capaz de adaptarse bien a la 5-número de resumen de la fijación abajo el ~1a, 25, 50, 75 y ~99 percentiles.
- Empecé con el 3-param skew-normal, pero es obvio que no tiene suficiente DOF a la perfección (o incluso de cerca) se ajustan a la 5-parámetros de entrada
- Estoy interpretando " min " y "max", como en la 1ª y 99 percentiles. Sé que esto es un boceto, pero los números introducidos son especulativas predicciones (="no te preocupes, no estoy arruinando la interpretación de los datos medidos")
- La simplicidad es una virtud. Lo ideal es que la distribución sería fácil fácil-ish hacer numéricos de los parámetros de estimación (forma cerrada sería el más bonito, ala http://www.johndcook.com/blog/2010/01/31/parameters-from-percentiles/ , pero que muy mucho de disparo de la luna, haciendo de optimización no lineal o algo que está muy bien)
- He empezado a buscar en distribuciones como GSN/CSN, etc de papeles como el de http://www2.warwick.ac.uk/fac/sci/statistics/crism/research/2012/paper12-08/12-08w.pdf pero no estoy muy seguro de que estoy mirando hacia abajo en el derecho de familia. Tal vez skew-normal no es el mejor lugar para empezar? También he pensado en cosas como Johnson distribución, que de lo poco que puedo encontrar sobre casi parece "diseñados para ser montados".
¿Qué distribución de la(s) debo observar?
Captura de pantalla de la herramienta: no ajuste la mediana en un skew-normal de distribución