En una regresión de ajuste se puede probar, si la simple agregación es la elección correcta. Supongamos que usted tiene un plan de datos mensual $Y_t$ y datos diarios $X_\tau$ (con el fijo $m$ días en un mes). Supongamos que usted está interesado en una regresión:
$$Y_t=\alpha+\beta \bar X_t +u_t, (1)$$
donde
$$\bar X_t=\frac{1}{m}\sum_{h=0}^{m-1}X_{tm-h}.$$
Aquí se supone que para cada mes $t$ el diario observaciones se $X_{30(t-1)+1},...,X_{30t}$. En este caso asumimos que cada día tiene el mismo peso, lo que claramente es una restricción. Así, podemos asumir que el modelo más general se tiene:
$$Y_t=\alpha+\beta \bar X_{t}^{(w)} +u_t,(2)$$
con
$$X_t^{(w)}=\sum_{h=1}^{m-1}w_hX_{tm-h}.$$
Hay un montón de artículos que exploran diferentes posibilidades de $w_h$. Generalmente se asume que el $w_h=g(h,\alpha)$, para alguna función $g$ que depende de los parámetros de $\alpha$. Este tipo de modelo de regresión es llamado MIDAS (Mezcla de Muestreo de Datos) de regresión.
Modelo (2) se inserta el modelo (1) por lo que es posible poner a prueba la hipótesis de que la $w_h=\frac{1}{m}$. Una de esas pruebas que se propone en este artículo (yo soy uno de los autores, lo siento por el enchufe descarado, también escribí un paquete de R midasr para la estimación y las pruebas de MIDAS regresiones donde esta prueba es implementado).
En un no-regresión configuración hay resultados que muestran que la agregación puede cambiar las propiedades de la serie de tiempo. Por ejemplo, si usted agregada AR(1) los procesos que la memoria a corto plazo (la correlación entre dos observaciones de la serie de tiempo rápidamente se apaga cuando la distancia entre ellos es mayor), usted puede obtener un proceso con la memoria a largo plazo.
Así que para resumir la respuesta es que la validez de la aplicación de la estadística en los datos agregados es un estadístico de la pregunta. Dependiendo del modelo se puede construir una hipótesis de si se trata de una aplicación válida o no.