Yo soy el análisis de un clima de datos para un curso de informática para el uso de hadoop.Estoy tomando todos los relacionados con el tiempo los problemas fuera de los análisis y que sólo buscan estrictamente en los ojos de estadísticas.
Digamos que hay 2 eventos 1 se produce 250 veces en el año, y el otro se produce el evento de 50 veces en un año. El segundo evento se produce cada día el primer caso ocurrió. Puedo decir que hay una relación entre los dos eventos? No estoy seguro de si es seguro decir que hay una buena probabilidad de que hay una relación entre los datos, ya que esto podría ser una coincidencia. Por ejemplo, si el evento se produjo Un 25 veces al año y el evento B se produjo el 15 de veces de nuevo el evento B ocurre cada vez que Un evento ocurrió que yo sería más seguro para decir que hay una relación entre los dos eventos, ya que hay menos probabilidades de que esto es una coincidencia debido a la cantidad de veces que Un evento ha ocurrido. Para decirlo en otras palabras, digamos que Un evento ocurrió 365 veces en el año y el evento B producido 10 veces en el año, el evento B, se producen cada vez que Un evento ocurrió, pero esto es sólo debido a Un evento ocurrido cada día así que no hay relación. ¿Hay algún tipo de estándar a decir que cuando dos eventos han estadísticamente una alta probabilidad de tener una relación de algún tipo?
él dataset de verificación para las relaciones en el corto plazo y a largo plazo (revise para ver si hay una relación reciente decir que en los últimos 3 meses, 1 año, pero también más de 4 años, 8 años, 10 años). Yo sé que por más de 10 años, puedo confiar que si ocurrieron los eventos siempre juntos probablemente hay una buena probabilidad de una relación debido a la gran momento, pero para distancias cortas, ¿hay algún tipo de método?
Espero que esto tenga sentido.