5 votos

¿Cómo puedo calcular la probabilidad de sufrir un accidente de tráfico en la US101 según el día de la semana y la hora del día?

Mi plan es este:

  • Encuentre una fuente de datos sobre cuándo y dónde se produjeron accidentes en EE.UU. 101
  • Encontrar una fuente de datos sobre el volumen de tráfico en la misma carretera
  • Subconjunto de datos para incluir sólo los accidentes ocurridos en la US101. entre San Francisco y Palo Alto.
  • Divida los accidentes por el volumen de tráfico para intervalos de tiempo tan pequeños como pueda obtener datos sobre el volumen de tráfico. Por ejemplo, si puedo obtener volumen de tráfico por hora, que sería grande, porque entonces puedo dividir media de accidentes en esa hora de un día determinado por el volumen de tráfico en esa ventana, y luego asumir, a falta de una idea mejor, que cada coche tiene la misma probabilidad de estar involucrado. Quizá pueda obtener algunos datos sobre los diferentes niveles de riesgo por la edad del conductor o el tipo de coche, pero me imagino que las compañías de seguros tienen esos datos y no son compartirlos.

Se agradecerán las sugerencias sobre fuentes de datos. Incluso si tengo que hacer algo pésimo como multiplicar el riesgo nacional per cápita por el volumen de tráfico, eso sería suficiente por ahora, mi principal problema es conseguir los datos. Se agradece cualquier sugerencia inteligente. (FYI: esto es sólo por interés personal)

2voto

mat_geek Puntos 1367

Creo que una covariable muy importante serían las condiciones meteorológicas. Creo que los datos meteorológicos de la región en la que se viaja son fáciles de obtener para correlacionarlos con los accidentes. El volumen de tráfico y la hora del día están probablemente muy relacionados. Pero la hora del día también puede estar relacionada con el momento en que es más probable que los más propensos a los accidentes estén en la carretera (conductores adolescentes y ancianos, por ejemplo). La presencia de conductores propensos a los accidentes no es una covariable que se pueda recoger, pero la hora del día puede ser un sustituto útil. Tenga en cuenta que para otras covariables importantes sobre las que no pueda recopilar datos directamente puede haber una covariable sustitutiva útil para utilizar en el modelo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X