Según un artículo de Preston y Coleman (2000), la fiabilidad de la escala de 2 ítems no difiere notablemente de la fiabilidad de la escala de 5 ítems:
El tema de medición era la satisfacción con los restaurantes, pero se traslada bien a la calificación de las películas. También se midió la facilidad de uso, la rapidez con la que se utiliza y la capacidad de una persona para expresar sus sentimientos en diferentes escalas de ítems. Los resultados son los siguientes:
Está claro que los usuarios encuentran la escala de 2 ítems ligeramente más fácil y rápida de usar en comparación con la escala de 5 ítems, pero también muy inadecuada para expresar las verdaderas creencias del usuario. Esto indica que la escala de 2 ítems no capta muy bien la variabilidad subyacente y da lugar a una pérdida de variabilidad. Los índices de discriminación también son notablemente más pobres para las escalas de 2 ítems en comparación con las escalas de 5 ítems.
Teniendo en cuenta todo lo anterior, especularía que Netflix está dispuesto a intercambiar cierta precisión en las votaciones para atraer a más usuarios a votar. Creo que prefieren que vote más gente, ya que aumenta la cobertura de la muestra. Esto puede conducir a una mejor comprensión de los usuarios menos comprometidos. El valor marginal de la información adicional para los usuarios menos comprometidos es probablemente mucho mayor en comparación con los usuarios comprometidos.