4 votos

¿Cuándo es apropiado agrupar datos?

Supongamos que tengo algunos datos sobre la cantidad de dinero gastado en anuncios de televisión y los ingresos totales de todas las ventas. Los datos están disponibles para tres meses separados.

                       Ene     Feb    Marzo 
$ gastados en anuncios de tv      100     110    150
ingresos totales de ventas    1000    1000   1500

El problema que estoy tratando de resolver es si la campaña de marketing (anuncios de televisión) tuvo un efecto significativo en los ingresos totales de ventas.

Ahora, todavía no estoy seguro de cómo proceder en términos de pruebas, análisis de series temporales, etc. (¿sugerencias?) Pero otro problema va a surgir, y se refiere a si agrupar o no los datos. ¿Debería realizar pruebas separadas para cada mes o combinar los datos juntos?

Entonces mi pregunta es: ¿Cuándo es apropiado agrupar datos para el análisis?

8voto

Niall Puntos 51

Es apropiado cuando los elementos que estás agrupando son homogéneos con respecto a los parámetros que estás estimando. Específicamente, esto significa que, si el modelo subyacente de cada componente es el mismo, con los mismos valores de parámetros, entonces está bien agrupar los datos. De lo contrario, es equivalente a dejar una interacción importante fuera de un modelo de regresión que puede causar inferencias engañosas.

Para contextualizar esto en tu ejemplo - si utilizaras regresión para evaluar la relación entre $ gastado en anuncios de televisión y ingresos totales de ventas entonces

Si la relación entre $ gastado en anuncios de televisión y ingresos totales de ventas es la misma en todos los meses, entonces está bien agruparlos juntos e ignorar por completo el mes. Pero, si el efecto depende del mes, entonces deberías potencialmente incluir interacciones que permitan que la pendiente y la intercepción varíen por mes. No estratificar tus estimaciones de parámetros por mes cuando realmente deberías hacerlo puede causar estimaciones engañosas del efecto de la variable (ver aquí para un ejemplo ilustrativo).

Entonces, la respuesta a tu pregunta se reduce a si crees que los efectos deberían variar por mes. Para mí, parece que probablemente deberían, pero ciertamente no estoy tan familiarizado con la aplicación como tú.

2voto

mat_geek Puntos 1367

Para agregar a lo que dijo Macro, puedes probar la suposición de la poolabilidad de los datos mensuales basándote en el análisis de series temporales. Pero requeriría mucha más datos mensuales. Con el análisis de series temporales podrías buscar una tendencia estacional de un ciclo anual. Incluso sin el análisis de series temporales, asumiendo que tienes varios años de datos disponibles, podrías buscar diferencias entre las medias mensuales y si parecen ser significativas entonces no agruparías los datos. La suposición para la prueba probablemente sería que los datos mensuales de cualquier mes (digamos enero) son independientes de un año al siguiente. Dada una serie lo suficientemente larga, podrías verificar esa suposición estimando la correlación de año en año.

1voto

JornC Puntos 81

En cuanto a cuestiones de agregación relacionadas con la publicidad y las ventas, podrías comenzar con Darryl Clarke y luego seguir las referencias.

Clarke, Darryl G. “Medición econométrica de la duración del efecto de la publicidad en las ventas.” Journal of Marketing Research 13, 4 (1976): 345–57.

Clarke señala que la duración del efecto decaimiento parece interactuar de manera incómoda con la frecuencia de la medición. Los datos semanales tienden a producir decaimientos en un corto número de semanas. Los datos mensuales en un corto número de meses. Los datos anuales en un corto número de años. Pero estoy resumiendo excesivamente un campo complicado.

O este resumen general de Tellis (que es una buena fuente para lo que ha sucedido en este campo): http://www-bcf.usc.edu/~tellis/AdGeneral.pdf

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X