5 votos

Uso de correlaciones para reetiquetar datos de Google Analytics

En mis datos de Google Analytics, una gran cantidad de tráfico se etiqueta erróneamente como "directo" porque Google no conoce la fuente de tráfico original.

He tomado los datos de tráfico "directo" de 6 meses y he calculado la correlación con otros canales de tráfico, como el orgánico y el social. Hay una correlación moderada entre Social y Directo.

Correlations of traffic data

Mi pregunta es... ¿hay alguna forma de ajustar las cifras de tráfico de "Social" (en una hoja de cálculo) para incluir parte del tráfico de "Directo", sabiendo que hay una correlación entre ambos?

Por ejemplo, digamos que GA informa actualmente de 1.000 visitas sociales y 5.000 directas, ¿puedo atribuir algunas de las directas a las sociales, por ejemplo? Social podría ser ahora 2.000.

Aunque conozco los niveles de correlación, no hay forma de saber cuánto de Directo es en realidad directo, por supuesto, así que no sé si este cálculo es posible, o si hay una forma científica de llevar a cabo el proceso.

Acepto que esto no será realmente exacto o definitivo, lo veo más como un indicador.

Gracias.

1voto

Judioo Puntos 625

La cantidad total de tráfico es una función determinista de Social, Directo, Referido y Z (imagina que Z es todas las otras fuentes combinadas - puedes dividirlas por separado si quieres).

$$\text{Traffic} = \text{Social} + \text{Direct} + \text{Referral} + \text{Direct}$$

Ahora lo que creo que sería útil para su situación es una estimación del efecto indirecto de la cantidad de tráfico social en las otras fuentes. Soy bastante ignorante en materia de SEO, pero me imagino que ser mencionado mucho en sitios de redes sociales populares aumenta tu rango de página, y por lo tanto aumenta indirectamente el tráfico de los resultados de búsqueda más altos (o de otras fuentes desconocidas). Podemos ilustrar esto es un modelo de ruta como el siguiente:

enter image description here

Como Tráfico es determinista, simplemente coloqué 1's en esos caminos. El efecto indirecto de lo social en la cantidad total de tráfico a través de lo directo es el primer camino multiplicado por el segundo camino (en modelos lineales), que es simplemente $1 \cdot d = d$ . Para rellenar los espacios en blanco de $d$ , $r$ et $z$ necesitas las covarianzas entre Social y los caminos indirectos.

Sin embargo, hay formas más informativas de dibujar el diagrama, pero todo se basa en la estimación de estas varianzas y covarianzas. Es típico estimar las correlaciones y luego rellenar los caminos basados en las correlaciones y correlaciones parciales. Otra forma informativa, sin embargo, puede ser después de estimar las correlaciones parciales es reescalar el diagrama para que todas las flechas que van al Tráfico sumen 100. Entonces los efectos directos en Tráfico pueden ser interpretados como porcentajes totales, y los efectos indirectos pueden ser interpretados como la descomposición del efecto indirecto de lo social. (Sin embargo, esta interpretación se vuelve un poco extraña si tiene correlaciones negativas).

Esto es, por supuesto, una simplificación. Es probable que las flechas entre lo social y los efectos indirectos no sean unidireccionales, pues ciertamente podría haber efectos recíprocos. Pero espero que sea una abstracción útil.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X