Estoy haciendo un estudio sobre StackExchange. La gestión de StackExchange ha demodded (por razones poco claras) un moderador, y ahora la red está en el fuego.
Actualmente, muchos de los moderadores renunciar o suspender sus actividades debido a que se encuentra satisfecho. Quiero recopilar y analizar datos acerca de estas renuncias. Me gustaría saber si hay un aumento o una disminución de la insatisfacción y si esto es estadísticamente significativo.
- Qué tipo de prueba puedo hacer para averiguarlo? En particular, necesito un poco de orientación sobre cómo analizar/modelo/definir este aumento (el problema es que no tengo lineal simple el modelo que me puede caber para el momento de los acontecimientos, podría ser no lineal, entonces, ¿cómo lidiar con eso).
Estoy planeando utilizar esta petición carta y esta listade renuncias a la definición de eventos. ¿Cómo puedo combinar todo esto en un modelo único?
Para los datos de sellos estoy pensando en usar los postes de meta-sitios en lugar de buscar en el texto.
Los tipos de eventos deseo recoger porque posiblemente más datos me permiten tener más poder en mi prueba?
Estoy pensando en crear algo así como una tabla en la que se ve como:
Id Moderator Event-Type Date-stamp 1 Monica Cellio Fired Sep 27 2 Glen_b diamond removed Oct 9 at 0:53 3 Gung suspending activity Oct 18 at 1:32 4 whuber weekly strike Oct 18, 25, ...
Idealmente, yo no estoy haciendo la tabla completa, porque eso es un montón de trabajo para los cientos de eventos, pero en lugar de hacer algo como un muestreo al azar (por ejemplo, cavar a través de mensajes como Gung s o GlenB del o comentarios como Whuber s). Así que esto debe ser una consideración para el modelo de prueba/que voy a aplicar.
Resultado parcial/trabajo
Basado en los comentarios que hicieron algunos de los primeros análisis de la petición de la carta de que los resultados en la siguiente imagen:
library(XML)
u <- 'https://dearstackexchange.com/'
html = htmlTreeParse(readLines(u), useInternal = TRUE)
dates = unlist(xpathApply(html, '//small', xmlValue))
dates <- text[-length(text)] # remove final value
times <- 5+(as.numeric(strptime(dates, "%b %d")) - as.numeric(strptime("Oct 5", "%b %d")) )/24/3600
t <- table(times)
plot(t, xlab = "date (month October)", ylab = "number of signatures")
Vemos este pico de firmas en el 7 de octubre y, a continuación, una disminución. Esto no es ninguna sorpresa y se refiere a lo que gridAlien describe en su/su/su puesto como un intital de disparo. Pero todavía hay un número restante de las firmas hacia el final del mes. Este número es creciente o decreciente?