Estoy tratando de poner a prueba un programa que pretende calcular algunas propiedades estadísticas de una secuencias numéricas (como media, mediana, desviación estándar, etc). Simples y cortas secuencias de pasar la prueba, pero me gustaría desafiar el programa, ya sea con largas secuencias o secuencias con grandes y pequeños valores (a prueba de desbordamientos/underflows) etc. Así que, ¿hay algún software o un recurso en línea o de otra fuente de diferentes secuencias numéricas con conocidas propiedades estadísticas?
Respuestas
¿Demasiados anuncios?El Instituto Nacional de Estándares y Tecnología tiene un conjunto de Estadística de Referencia de los conjuntos de datos que provee de referencia de los conjuntos de datos con los valores certificados por una variedad de métodos estadísticos", que incluye un conjunto de etiquetadas 'univariado de las estadísticas de resumen' con los valores certificados para la media, la desviación estándar y el gal-1 de autocorrelación.
No parece incluir los valores de la mediana, pero el cómputo exacto de la mediana no debería ser un problema. Eficiente el cálculo de la muestra la mediana es un poco más difícil.
Usted podría tener su favorito estadísticas de la caja de herramientas (la mía es de R) y el uso que para comenzar a generar largo unicc de datos. En R, por ejemplo, es posible generar datos de todo tipo de distribuciones. De esta manera usted puede validar que este programa son la prueba está en línea con el resto de sus estadísticas del programa. Que sólo se compara el rendimiento, por ejemplo, el R, pero me gustaría confiar R en este sentido :).