7 votos

¿Cómo calcularías TÚ la puntuación de una película en la IMDB?

Lo hago sólo para aprender. No tengo intención de invertir los métodos de IMDB.

Me pregunté si era dueño de IMDB o un sitio web similar. ¿Cómo calcularía la calificación de la película?

Lo único que se me ocurre es Media aritmética

Para los datos de una película proporcionados a continuación el cálculo sería

(38591*10 + 27994*9 + 32732*8 + 17864*7 + 7361*6 + 2965*5 + 1562*4 + 1073*3 + 891*2 + 3401*1) / 134434 = 8.17055953

alt text


Mi puntuación es de 8,17055953, que se acerca a la media aritmética de IMDB.

  1. ¿Qué pasa con mi puntuación? ¿Por qué no es ideal (porque IMDB no la utilizó)?
  2. Si tuvieras que calcular. ¿Cómo lo habrías hecho? ¿Qué factores tendrías en cuenta?

Nota:

No estoy preguntando por el mecanismo de clasificación del listado Top/Bottom (que se muestra aquí : http://www.imdb.com/chart/top ). Esta pregunta se refiere a cómo IMDb convierte la media aritmética en la media ponderada. Por ejemplo, "Manos: Las manos del destino" - Media no ponderada 2,1, media ponderada 1,5. (O "El Padrino", otro ejemplo de relleno de papeletas).

8voto

John Puntos 453

Respuesta parcial. Consulte la página de ayuda titulada: La media de votos para la película "X" debería ser Y. ¿Por qué muestra otra calificación?

En resumen, IMDb utiliza:

un complejo sistema de ponderación de los votantes para asegurarse que la calificación final sea representativa de la población votante en general población votante y no esté sujeta a la influencia de individuos que no son que no participan regularmente en la encuesta.

También hay que tener en cuenta que:

Para evitar que el sistema se preste a abusos, [IMDb] no revela los métodos exactos utilizados.

7voto

Eric Davis Puntos 1542

Primero, definir el constructo teórico de interés. Hay muchas formas de definir una calificación:

  • ¿Cuál es la población objetivo teórica? ¿El mundo entero, los angloparlantes, las personas que visitan IMDB, las personas que han visto la película en cuestión?
  • ¿Cuál es el plazo previsto? Es la calificación de la película ahora o promediada a lo largo de su tiempo de estreno.
  • ¿Es una calificación democrática o una calificación de experto? Algunas personas tienen más conocimientos sobre la valía de las películas. Algunas personas son más capaces de diferenciar una película buena de una mala. Algunas personas son más constantes en sus valoraciones a lo largo del tiempo. ¿Debería darse más valor a las valoraciones de las personas que son "mejores" en la valoración de las películas? Esto está relacionado con una cuestión filosófica de estética y el significado de la bondad intersubjetiva.
  • Suponiendo que pudiera obtener calificaciones honestas de toda la población objetivo en todo el período de tiempo ponderado o no por la experiencia, ¿cuál es la correspondencia entre estas calificaciones y la calificación compuesta? Podría ser la media aritmética. Alternativamente, hay muchas otras formas de combinar las calificaciones individuales. Por ejemplo, se podría utilizar una mediana interpolada. Algunas alternativas tendrían un efecto mínimo en el orden de clasificación de las películas, pero tendrían una gran influencia en el valor absoluto de la calificación.
  • ¿El número de personas interesadas en la película es relevante para la calificación?

En segundo lugar, utilizar toda la información disponible para estimar el constructo teórico . Aquí es donde los temas discutidos por otros serían importantes.

  • el papel de los ajustes demográficos dependerá de su definición de la población objetivo
  • se podría incorporar un peso para la confianza. Se podrían utilizar muchos indicadores:
    • el número de valoraciones previas (un mayor número de valoraciones sugiere que alguien está más comprometido con el sitio)
    • el grado de coherencia de las calificaciones anteriores con otros calificadores o, al menos, con un subconjunto de calificadores (una mayor coherencia sugeriría una respuesta reflexiva y honesta;
    • el grado de distribución de las respuestas a lo largo de un periodo de tiempo prolongado (esto sugeriría que es menos probable que la persona intente engañar al sistema)
    • grado de compromiso con el sitio en general: por ejemplo, acceder al sitio, contribuir a los foros de debate (a mayor compromiso, mayor confianza)
  • como menciona @csgillespie se podrían ponderar más los votos recientes si se quiere estimar las actitudes actuales hacia la película
  • Podría ponderar la experiencia en las calificaciones. Esto estaría correlacionado con las calificaciones de confianza, pero hay una diferencia.

Tercero, validar y controlar el proceso de estimación utilizando fuentes de datos externas de confianza.

5voto

Eggs McLaren Puntos 945

¿Qué pasa con mi puntuación? ¿Por qué no es ideal (porque IMDB no lo utilizó)?

Si la puntuación era sólo para su uso, entonces no hay nada malo en su cálculo. Sin embargo, IMDB trata de dificultar que la gente influya obviamente en la puntuación final.

Si tuvieras que calcular. ¿Cómo lo habrías hecho? ¿Qué factores considerarías?

He aquí algunos factores que podría tener en cuenta (pero que no podrá comprobar):

  1. La puntuación final puede ser ponderada en función del número de votos emitidos.
  2. Los votos pueden ser ponderados por una variable temporal. Por ejemplo, los votos emitidos el año pasado son menos importantes que los emitidos hoy.
  3. Los votos emitidos por usuarios que han votado por otras películas tienen más peso, es decir, un coeficiente de reputación.
  4. Quizás incorporen datos de otros sitios.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X