Recientemente he descubierto la Ley de Benford. Me parece muy fascinante. Me pregunto ¿cuáles son algunos de los de la vida real de los usos de la ley de Benford. Ejemplos específicos sería genial.
Respuestas
¿Demasiados anuncios?Puede o puede no ser útil para la detección del fraude en las elecciones, por ejemplo, el de las elecciones Iraníes de 2009.
Algunos enlaces:
http://sbseminar.wordpress.com/2009/06/15/benfords-law-and-the-iranian-election
http://www.fivethirtyeight.com/2009/06/statistical-evidence-does-not-prove.html
Algunos de los datos generados por las Matemáticas de Intercambio de la Pila en sí mismo (y, presumiblemente, por los sitios similares) debería aproximadamente siguen la ley de Benford. Estos incluyen la distribución de los primeros dígitos de
- La frecuencia de la etiqueta de uso,
- Número de votos para las preguntas,
- Reputación de usuario,
- Número de vistas de preguntas.
Esto es debido a que la ley de Benford se aplica a crecer exponencialmente la cantidad y el número total de todas estas cantidades deben estar creciendo de manera exponencial. Es sólo aproximado debido a los artefactos en la forma en que algunas de estas cantidades se determinan y porque necesita de varios órdenes de magnitud con el fin de ver la ley de Benford realmente una patada en el.
De todos modos, me decidí a probar esto para los tres primeros. Los primeros dígitos en realidad no estaban tan difícil de compilar debido a que el sitio le permite ordenar los tres primeros de mayor a menor. (Por desgracia, no le permiten ordenar el cuarto de esa manera, y no me siento como vadeando a través de 2200+ preguntas para recoger los datos.) Aquí están los resultados que he conseguido en los tres primeros.
Etiqueta De Uso
(Datos recogidos del 25 de octubre de 2010).
No es un mal ajuste, sobre todo si se considera que sólo hay tres órdenes de magnitud representada en esta medida. Hay un número desproporcionadamente grande de etiquetas que fueron creados, pero sólo se usa una vez, lo que explica la mayor frecuencia de 1 como primer dígito.
Votos Por Pregunta
(Datos recogidos 26 de octubre de 2010.)
También no es un mal ajuste, especialmente ya que actualmente sólo hay dos órdenes de magnitud representada en esta medida. También, tiré las preguntas con 0 y los números negativos de los votos.
Usuario Reputación
(Datos recogidos de octubre 25 y 26 de 2010).
Este es el peor ajuste de los tres, como la frecuencia de 1 como primer dígito es mucho más grande que los demás. Sin embargo, hay un número muy grande de usuarios que nunca han publicado una pregunta o una respuesta y por lo tanto tienen un rep de 1. Y, por razones desconocidas para mí, hay también un gran número de usuarios que tienen una reputación de 101, a pesar de nunca haber preguntado o responder una pregunta.
Si se quita 1 como un posible primer dígito y, a continuación, cambiar la escala de la ley de Benford probabilidades de considerar sólo la 2 a la 9 como sea posible primeros dígitos, a continuación, la imagen se ve como la siguiente, que es mucho mejor Benford ajuste.
Ciertamente, ninguno de estos conjuntos de datos pasaría de Pearson chi-cuadrado para bondad de ajuste con respecto a la Benford probabilidades a un razonable nivel de significación. Sin embargo, dado que algunos de los artefactos en los datos y el hecho de que son relativamente pocos los órdenes de magnitud representada, el ajuste con la ley de Benford no es realmente malo.
Aquí está un artículo de hace un año en el alemán Economic Review, en el que los autores utilizan la ley de Benford para analizar datos económicos entre los países que usan el euro. Ellos encuentran que Grecia económicos de datos justo antes de entrar en el euro difería significativamente de la la ley de Benford predicciones. La implicación es que Grecia puede haber manipulado sus números en orden a cumplir con los términos del Tratado de Maastricht (que establece los criterios para ser miembro pleno de la Unión Monetaria Europea). Véase, por ejemplo, esta entrada del blog. Esto me parece particularmente interesante a la luz de Grecia recientes problemas financieros.
He aquí el resumen del artículo: "Para detectar la manipulación o fraude en los datos contables, los auditores han utilizado con éxito la ley de Benford como parte de sus procesos de detección de fraude. La ley de Benford se propone una distribución para los primeros dígitos de los números en forma natural de los datos. El gobierno de la contabilidad y las estadísticas son similares en naturaleza a la contabilidad financiera. En la Unión Europea (UE), hay presión para cumplir con el Pacto de Estabilidad y Crecimiento de los criterios. Por lo tanto, como las empresas, los gobiernos pueden tratar de hacer que su situación económica parece mejor. En este trabajo se utiliza un Benford prueba para investigar la calidad de los datos macroeconómicos relevantes para el déficit criterios informó Eurostat por los estados miembros de la UE. Nos encontramos con que los datos reportados por parte de Grecia muestra la mayor desviación de la ley de Benford entre todos los estados de la eurozona." (el énfasis es mío)
Ver también esta pregunta en quant.SE (donde por primera vez me enteré de esto).