6 votos

¿Es posible calcular Q1, Q3, promedio, DesvEst de datos ya agregados?

Tenemos datos de que conseguirá agregado por hora en los siguientes valores

  • Q1
  • La mediana de
  • La media de
  • Q3
  • Desviación Estándar
  • Max
  • Min
  • Recuento de Valores

De modo que los datos se verá más o como esta en la final.

        00:00-01:00     01:00-02:00     02:00-03:00     03:00-04:00          ...
--------------------------------------------------------------------------------
Q1            68,72           69,64           64,31           64,40          ...
Median       118,72          124,42          115,54          118,11          ...
Mean         119,17          119,97          117,23          117,60          ...
Q3           169,64          171,72          170,63          168,72          ...
StDev         59,30           59,15           61,23           59,62          ...
Max          219,70          219,44          219,76          219,71          ...
Min           15,02           15,07           15,05           15,05          ...
Count       1000,00         1000,00         1000,00         1000,00          ...

Ahora queremos agregar los mismos valores para un día entero (24 horas) sin necesidad de utilizar los datos originales si es posible (debido a que en nuestro real el escenario requeriría mucho más tiempo que el agregado de aquellos).

Para la mayoría de ellos es bastante sencilla, como mínimo, que es simplemente el general MIN, AVG es el AVG, etc.

Pero la parte difícil es la Q1, la Mediana Q3 y Desvest.

Por lo que entiendo que no es posible simplemente calcular la media (ponderada) de valor de los 24 valores independientes. Pero hay un método para lograr esto desde ya valores agregados (por ejemplo, almacenamiento de datos adicionales)?

Es la diferencia de un gran conjunto de datos importantes, incluso?

O los datos siempre será distorsionada, excepto para el cálculo de todo el conjunto de datos?

6voto

Aksakal Puntos 11351

Tienes media, cuenta y Desvest de las observaciones, de manera agregada Desvest es una cuestión de álgebra. Estoy seguro de que se puede averiguar fácilmente.

Los cuantiles son más difíciles. Considerar, Q1 de dos muestras. De que forma los límites de la Q1 de la muestra combinada. Si $Q1_1>Q1_2$, entonces es fácil ver que agregada $Q1_2<Q1$$Q1<Q1_1$. Eso es todo lo que puedo decir acerca de los cuantiles, es decir, en su caso $min(Q1_i)<Q1<max(Q1_i)$.

Usted puede obtener un poco más de tus datos mediante el uso de asintótica de la muestra de los cuantiles de la distribución. En este caso, en lugar de llegar a los límites, se podría estimar el Desvest de los cuantiles. Usted tendría que asumir que la distribución no cambia durante el día.

Alternativamente, usted podría tratar de estimar los cuantiles durante el día, por ejemplo, son más altos en la mañana y bajas en la noche. En este caso, puede ejecutar una prueba para ver si este es el caso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X