5 votos

¿Cuál es la mejor manera de determinar si páginas vistas son tendencias hacia arriba o hacia abajo?

Dado el siguiente conjunto de datos para un solo artículo en mi sitio:

donde la columna 1 es la fecha y la columna 2 es el número de páginas vistas por un artículo. ¿Qué es un cálculo de la aceleración básica que puede hacerse para determinar si este artículo es tendencia hacia arriba o hacia abajo por días tengo datos pageview para él?

Por ejemplo, mirando los números puedo ver que artículo1 es tendencia hacia abajo. ¿Cómo puede que se refleja en un algoritmo más fácilmente?

¡Gracias!

4voto

Eric Davis Puntos 1542

Reflexiones generales sobre el número de páginas vistas

Creo que hay una buena cantidad de dominio específico de conocimiento que puede ser ejercida en opiniones de la página. Desde el examen de mis estadísticas de Google Analytics a partir de determinados artículos del blog, observo las siguientes características:

  • Gran pico inicial en el número de páginas vistas cuando un artículo es publicado por primera vez el relacionado con éxitos procedente de fuentes RSS, enlaces de sindicación de los sitios, la prominencia en la página de inicio, los picos relacionados con la novedad y medios de comunicación social. Este efecto tiende a disminuir rápidamente, pero parece que todavía proporcionar algún refuerzo para un par de semanas.
  • Día de la semana efectos. Al menos en mi blog sobre estadísticas, puedo obtener una constante de día de la semana en efecto. Hay un momento de calma en el fin de semana. La implicación es que si yo estuviera tratando de entender las tendencias significativas en un artículo, me gustaría estar buscando en los cambios de la semana a la semana en lugar que en el día a día.
  • Efectos estacionales: también tengo más sutiles efectos estacionales presumiblemente relacionado con cuando la gente está trabajando o de vacaciones y para algunos puestos más que otros cuando los estudiantes de la universidad están estudiando o no. Por ejemplo, la semana entre Navidad y año Nuevo, es muy tranquilo.
  • Después del pico inicial, encuentro que la mayoría del tráfico es impulsado por Google las búsquedas, aunque un par de posts derivar considerable tráfico de enlaces desde otros blogs o sitios web. Enlaces de medios Sociales y en los blogs tienden a llevar a los abruptos picos en opiniones de la página y dependiendo del tipo de medio puede o no conducir a una corriente constante a través del tiempo.

Implicaciones para la identificación de la alza o a la tendencia a la baja en una página

  • El análisis anterior ofrece un modelo general que yo uso para entender las páginas vistas en mi propio blog. Es una teoría de algunos de los principales factores que influyen en opiniones de la página, al menos en mi sitio y a partir de mi experiencia. Creo que tener un modelo como este, o algo similar, ayuda a refinar la pregunta de investigación.

  • Por ejemplo, es de suponer que usted está interesado sólo en algunas formas de hacia arriba y hacia abajo de las tendencias. Las tendencias que operan en todo el sitio, tales como el día de la semana y las tendencias de la temporada probablemente no son el foco principal. Del mismo modo, las tendencias relacionadas con el pico inicial en el número de páginas vistas y el posterior descenso tras una publicación son relativamente obvia y puede no ser de interés (o tal vez son).

  • Hay también una cuestión relacionada con el marco de tiempo y la forma funcional de tendencia. Una página puede estar aumentando gradualmente cada semana el número de páginas vistas, debido a la paulatina mejora de su posicionamiento en los algoritmos de Google o general de la popularidad del tema del post. Alternativamente, un post puede experimentar un aumento brusco como resultado de estar vinculado a través de un sitio web de alto perfil.

  • Otro tema se refiere a los umbrales para definir la tendencia. Esto incluye tanto la significación estadística y los tamaños del efecto. I. e., es la tendencia estadísticamente significativamente diferente de la variación aleatoria que se pueden ver, y es el cambio digno de su atención.

Estrategia Simple para la detección de tendencias interesantes en el número de páginas vistas

Yo no soy un experto en análisis de series de tiempo, pero aquí están algunas ideas sobre cómo podría implementar esta herramienta.

  • Me gustaría calcular una tabla que compara el número de páginas vistas durante los últimos 28 días 28 días antes de la mayoría de los últimos 28 días. Usted podría hacer esto más adelantado, haciendo de marco de tiempo de una cantidad variable (por ejemplo, 7 días, 14 días, de 56 días, etc.). El más popular de la página (y el sitio en general), más probable es que usted va a tener suficiente de páginas vistas en un período para hacer comparaciones significativas. Cada fila de la tabla sería una página en su sitio. Se comenzaría con tres columnas (de la página título de la página actual opiniones, comparación de vistas de página)
  • Filtro de páginas que no existen para la totalidad del período de comparación.
  • Agregar columnas que ayudar en la evaluación del tamaño del efecto de cualquier cambio, y la significación estadística de cualquier cambio. Un simple resumen de la estadística a utilizar sería porcentaje de cambio de comparación con los actuales. Usted también podría incluir raw cambio de comparación con los actuales. Tal vez una de chi-cuadrado podría ser utilizado para proporcionar una cuantificación aproximada de la importancia de cualquier cambio (aunque soy consciente de que la suposición de independencia de las observaciones que a menudo se ve comprometida, lo que plantea la cuestión de si usted está utilizando el número de páginas vistas o únicas, páginas vistas).
  • Me gustaría, a continuación, crear una composición de el tamaño del efecto y la importancia de la prueba para representar el "interés".
  • Usted podría también adoptar un punto de corte para cuando un cambio es lo suficientemente interesante, y por supuesto clasifican como hacia arriba o hacia abajo.
  • Entonces, usted puede aplicar la ordenación y el filtrado de herramientas para responder a preguntas particulares.
  • En términos de implementación, todo esto podría hacer uso de la R y la exportación de datos a partir de herramientas como Google Analytics. También hay algunas interfaces entre R y Google Analytics, pero no he probado personalmente.

2voto

Owen Fraser-Green Puntos 642

Simplemente construir un modelo ARIMA señal independiente del ruido incorporando cualquier estructura determinista identificable tales como cambios en los niveles/tendencias/seaonal pulsos/parámetro o cambio de la varianza en el tiempo. Desarrollar una predicción para los próximos 5 días y utilizar la incertidumbre de esa suma para crear límites posibles. Compare la suma actual de "nuevas lecturas de cinco" y calcular el pobability de rendimiento de un valor como "alta" o tan diversos como este.

2voto

Chris Bunch Puntos 639

Jeromy Anglim y IrishStat tanto dar grandes respuestas, pero suenan tal vez un poco más complejo de lo que usted está buscando.

  1. Un método más simple podría ser llevar a cabo una regresión lineal en los datos, para obtener PageViews = a * Date + b para algunas constantes a y b; la constante a es entonces una medida de la lineal "pendiente" de los datos, que se puede utilizar para medir cuánto el enlace está en tendencia. Sin embargo, esto podría no funcionar tan bien si los datos no siguen una tendencia lineal (en el ejemplo en su otro enlace se ve bastante lineal, pero usted podría imaginar que su enlace en su lugar ha ido creciendo de manera exponencial últimamente).

  2. Otra posibilidad podría ser la de convertir el número de páginas vistas en rangos (por ejemplo, en el artículo 1, 100 es el valor más bajo, para convertirlo en un 1; 80 es la 2ª a la de menor valor, para convertirlo en un 2; 60 es el valor más alto, para convertirlo en un 3) y, a continuación, tomar la correlación de estos rangos con (1,2,...,n) (donde n es el número total de las fechas que usted tenga).

Por ejemplo, si el artículo se comporta como

Date, PageViews, Rank
June 1, 100, 1
June 2, 120, 3
June 3, 115, 2
June 4, 125, 4
June 5, 150, 5

A continuación, habría que tomar la correlación entre (1,3,2,4,5) y (1,2,3,4,5) para conseguir un trending puntuación de 0.9. (Tenga en cuenta que bajo este método, sin embargo, el número de páginas vistas de (100, 120, 115, 125, 150) tienen la misma tendencia de puntuación como (100, 300, 299, 7000, 35000), que puede o no puede ser lo que usted desea, ya que el último está creciendo más rápido. En otras palabras, este método te dice cómo de fuerte es la dirección de la tendencia, pero no la magnitud. Si quieres obtener una idea de la magnitud, entonces usted podría simplemente repita estos métodos en el día a día de los cambios de número de páginas vistas, es decir, determinar si el día a día los cambios son tendencias hacia arriba o hacia abajo.)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X