7 votos

¿Cómo simular un sistema en el que "la probabilidad de fallo por semana es del 3,5%"?

Tengo un sistema descrito por un enunciado como "La probabilidad de fallo por semana a 20 grados centígrados es del 3,5%", ¿cómo puedo simular un sistema así?

La simulación que tengo en mente debe responder a preguntas como "¿cuántos fallos se producirán en 13 días?"

La simulación debería producir, por ejemplo, una tabla como la siguiente:

timestamp,number of failures at the timestamp
2015-01-16T07:00:00Z,0
2015-01-17T07:00:00Z,0
2015-01-18T07:00:00Z,0
2015-01-19T07:00:00Z,1
2015-01-20T07:00:00Z,1
2015-01-21T07:00:00Z,1
2015-01-22T07:00:00Z,2

Me gustaría simular un sistema de este tipo en R, tal vez utilizando una distribución de Poisson, pero no tengo ni idea de cómo empezar, creo que debe ser algo bastante simple, pero tal vez me falta algo de base, ¿puede sugerir un ejemplo o un tutorial?

1 votos

El Poisson proceso parece ser una buena idea. ¿Sabe usted lo que es? Pero, ¿realmente necesitas todos los fallos durante el tiempo de observación, o sólo el número total de fallos? En el segundo caso, no hace falta un proceso de Poisson, sólo una distribución de Poisson.

0 votos

Creo que necesito el proceso de Poisson, no estoy familiarizado con él... No soy capaz de relacionar mi probabilidad expresada en porcentaje con la "lambda" de Poisson.

1 votos

Dejemos que $T$ sea el periodo de observaciones. Entonces, si se utiliza la distribución de Poisson ${\cal P}(\lambda T)$ puede interpretar $\lambda$ como el índice de fracaso. Pero no estoy seguro de entender la "probabilidad de fracaso".

7voto

Michael Osl Puntos 168

Consideremos primero el caso de que tengamos una sola máquina. Tendremos que hacer algunas suposiciones, y una común y sencilla es modelar el tiempo de fallo como distribuido exponencialmente. Esto significa que la tasa de fallos es constante (la probabilidad de fallo entre el tiempo t y t+1, dada la supervivencia hasta el tiempo t es constante para todo t) (ver wiki para más información).

El tiempo hasta el fracaso, vamos a denotarlo por $T \sim Exp(\lambda t)$ donde t indica el tiempo en días. Primero tenemos que encontrar $\lambda$ y como sabemos que la probabilidad de fracaso en una semana es del 3,5%, obtenemos: $P(T < 7) = 1-e^{-7 \lambda} = 0.035$ . Si lo resolvemos, obtenemos $\lambda = 0.00221$ .

Ahora, para simular los fallos de $N$ máquinas a medida que avanza el tiempo, podemos dibujar $N$ se muestrean a partir de una distribución exponencial con $\lambda = 0.00221$ . Esto le dará los tiempos de fallo del $N$ máquinas en días.

1 votos

Esto también funciona bien debido a la propiedad de olvido del exponencial: dado has sobrevivido esta última, la probabilidad de que falles esta próxima semana es igual a la de la semana pasada, es decir, tu supervivencia es independiente del tiempo que hayas sobrevivido. (Consecuencia de una tasa de riesgo constante). Esto significa que si empezamos con $N$ máquinas, siempre habrá un 3,5% de fallos cada semana (de media).

0 votos

¿Puedes comprobar tus matemáticas? Tengo lambda=-log(1-0.035)/7 y así lambda = 0,00509

1voto

AdamSane Puntos 1825

Parece que no necesitas información con más frecuencia que la diaria, así que el enfoque más obvio sería calcular la distribución del número de fallos por día, y luego simular a partir de eso.

Como alternativa, puedes simular los tiempos exponenciales entre eventos y partir de ahí. De este modo se obtiene una precisión intradiaria si se necesita información a ese nivel.

"¿Cuántos fracasos habrá en 13 días?"

Esto se puede calcular sin simulación. Para hacerlo con la simulación diaria, podrías simular conjuntos de 13 días muchas veces y mantener la distribución de valores simulada.

Esto es muy fácil en R.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X