Actualmente estoy trabajando en un proyecto de investigación si Google Trends se puede predecir eventos de conflicto en conflictos intraestatales.
Por lo tanto tengo dos conjuntos de datos diferentes; el semanario de Google de búsqueda de Tendencias en el volumen y el número de eventos de conflicto por semana. Mi idea era hacer la siguiente prueba de hipótesis:
El uso de un brote algoritmo de detección de la R-package
surveillance
. Esto me dará binomio valores (brote/ningún brote) por cada semana en mi conjuntos de datos. La idea era que los algoritmos sería capaz de correctamente y de forma automática identificar los "picos" en mis datos.Evaluar el binomio clasificadores (entonces, si hay un "brote" en los datos de Google Trends para la semana t y hay un "brote" en el conflicto de los datos en la semana t+1 yo tendría un verdadero positivo etc.).
Estoy, sin embargo, no es totalmente seguro, el algoritmo que se proporciona en el paquete sería adecuado para mi tipo de datos (que asumo que no sigue las tendencias de la temporada, tan fuerte como la enfermedad de los datos), ya que mi fondo no está en la epidemiología y de mi conocimiento de la estadística es bastante limitada. Yo lo que sería agradecido por las sugerencias o consejos!