14 votos

Cómo medir la "redondez" de la SE, a los contribuyentes?

Intercambio de la pila, como todos sabemos, es una colección de Q&A sitios distintos temas. Suponiendo que cada sitio es independiente de los demás, dado que las estadísticas tiene un usuario, cómo calcular su "redondez" en comparación con el tipo de al lado? ¿Cuál es la herramienta estadística que debo emplear?

Para ser honesto, yo no sé muy bien cómo definir matemáticamente la "redondez", pero debe tener las siguientes características:

  1. Todas las cosas en igualdad de condiciones, la más rep tenga el usuario, más bien redondeado es
  2. Todas las cosas en igualdad de condiciones, los sitios más de un usuario que participa, el más completo que él es.
  3. Si la respuesta o la pregunta no afectar el bien de la redondez

10voto

Dillie-O Puntos 16780

Usted necesidad de dar cuenta de la similitud entre los sitios. Alguien que participa en StackOverflow y Experimentados Consejos es más bien redondeado que alguien que participa y CrossValidated, que es a su vez (yo diría) más bien redondeado que alguien que participa en y Programadores. Sin duda hay muchas maneras de hacerlo, pero usted puede comprobar la superposición de registro para sólo tener una idea de ella.

7voto

Eran Medan Puntos 193

EJEMPLO: digamos que hay tres sitios, y nosotros queremos comparar el bien redondeado de los Usuarios a, B, C. escribimos la reputación de los usuarios a través de los tres sitios en el vector de la forma:

Usuario: [23, 23, 0]

Usuario B: [15, 15, 0]

Usuario C: [10, 10, 10]

Consideramos más bien redondeado que B (su reputación ambos están repartidos uniformemente a través de dos sitios, pero tiene más reputación total). También, se consideran C o más bien redondeado que B (tienen el mismo total de reputación, pero la C tiene un repartidas en más sitios). Es indeciso sobre si debe ser considerado más bien redondeado que C, o vice-versa.

Vamos $x_A$, $x_B$, $x_C$ estar por encima de la reputación de los vectores respectivamente.

Queremos medir la "redondez" de un usuario en función de su reputación de vectores $f(x)$. Por lo anterior, nos gustaría que nuestra función $f$ a satisfacer $f(x_A) > f(x_B)$, e $f(x_C) > f(x_B)$.

Cualquier $f(x)$ que es cóncava y creciente hará el truco.

Dos ejemplos comunes de las funciones convexas son los 'fraccional de la norma

$$ f([x_1,...,x_m]) = \sum_i x_i^p $$

para $0 < p < 1$.

Tomando $p = 1/2$, podemos calcular

$$f(x_A) = 2\sqrt{23} \approx 9.6$$ $$f(x_B) = 2\sqrt{15} \approx 7.7$$ $$f(x_C) = 3\sqrt{10} \approx 9.5$$

De acuerdo a la $1/2$-norma, el Usuario será considerado como el más redondo de los tres, por un estrecho margen sobre el Usuario C.

Otra opción para $f$ es la (a escala) de la entropía de Shannon

$$ f([x_1,...,x_m]) = -\sum_i x_i \log(x_i/c). $$

donde $c = \sum_i x_i$.

Si tomamos $f$ a de la escala de la entropía de Shannon, a continuación, calculamos

$$f(x_A) = 46 \log(2) \approx 31.9$$ $$f(x_B) = 30 \log(2) \approx 20.8$$ $$f(x_C) = 30 \log(3) \approx 33.0$$

Medido según la escala de la entropía de Shannon, entonces, podríamos decir que C es de los más completos de los tres, y el segundo más bien redondeado.

EDIT: me dijo originalmente la función de $f(x)$ tenía que ser convexa; la verdad es lo contrario.

EDIT2: se ha Añadido un ejemplo en la luz de whuber del comentario.

6voto

MGOwen Puntos 122

Esta es realmente una pregunta muy interesante (de hecho estoy un poco enamorado de la idea de la modelización de la pila de sitios de exchange en general).

Sobre el tema del bien redondeado, una manera de evaluar este sería a través de las etiquetas que los usuarios tienden a responder, y su distribución a través de los sitios. Los ejemplos pueden hacer esto más claro.

Yo soy un miembro en TeX, StackOverflow, CrossValidated y AskUbuntu. Ahora, yo realmente sólo contribuyen a aquí y StackOverflow, y sólo alrededor de R en Stackoverflow. Entonces,para definir bien redondeado miraba a) la cantidad de etiquetas que dos sitios tienen en común (para definir la similitud entre sitios) y el grado en el que un usuario contesta a las preguntas sobre los sitios que tienen poca o ninguna etiqueta en común.

Si, por ejemplo, alguien que contribuye a Python etiquetas en StackOverflow y la cocina, que la persona es más bien redondeado que alguien que está respondiendo a las preguntas de software estadístico preguntas (por ejemplo) en el Desbordamiento y las estadísticas de las preguntas aquí.

Espero que esto es algo útil.

6voto

Boris Tsirelson Puntos 191

Si se define "bien-redondeado' como 'que contribuye a que muchos diferentes Sitios de Intercambio de la Pila,' quisiera calcular la métrica de la contribución de cada sitio. Usted puede utilizar el total de puestos de trabajo, o el promedio de mensajes por día, o tal vez reputación. Veamos entonces la distribución de este indicador en todos los sitios, y calcular la asimetría de alguna manera que tenga sentido.

En otras palabras, un 'bien redondeado' persona que iba a ser uno de los que contribuye a muchos sitios diferentes, mientras que un 'no bien redondeado' persona que iba a ser uno de los que principalmente contribuye a un sitio. Se podría mejorar aún más este por su escala métrica con un usuario en total a través de todos los sitios. es decir, alguien que ha contribuido mucho a muchos sitios diferentes, debe ser considerado más bien redondeado que alguien que no aportó nada a ninguno de los sitios. Una persona que nunca lo ha utilizado SÍ no es muy completo!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X