Estoy tratando de pasar de una relación funcional entre una variable predictora y una probabilidad de que ocurra un evento ($P = f(X)$) para un índice general en el que se produce el evento. Mi escenario es la estimación de las tasas anuales de peces de escape de un depósito dado una relación entre la media diaria de descarga $Q$ y la probabilidad de que un pez se escape dado dijo la descarga, es decir $P = f(Q)$. Supongamos que $P = f(Q)$ es una discreta relación, es decir, me han discretizado la función continua $f(Q)$.
Me estoy poniendo de muy bajos valores para mi anual de escape de la tasa en comparación con lo que los datos empíricos sugieren (~3% vs 13%), por lo que me preocupa que mi metodología para la mejora de diario anual de escape de la probabilidad de fallas. Mi pensamiento original para el cálculo de la probabilidad anual de escape es la fórmula
$$ P_{anual} = \sum_i 1 - [1 - P(Q_i)]^{d_i} $$
donde $Q_i$ es una descarga determinada a partir de la discretización de $f(Q)$ $d_i$ es el número total de días en un año en el que el embalse de descarga se celebró en la tarifa. Sin nada mejor información y da una bastante grande de la población de peces en el embalse, supongo que la tasa anual de escape es igual a la probabilidad anual de escape, es decir,
$$ N_{escapó} = N*P{anual} $$ donde $N$ es el punto de partida de la población de peces de ese año y $N_{escaped}$ es el número de peces que se escaparon de ese año.
Buscando en todo el sitio, parece ser que hay cierto debate sobre si mi definición de $N_{escaped}$ es aceptable, y no estoy seguro de que estoy correctamente la definición de $P_{annual}$ o que no se traduce a $N_{escaped}$ la manera en que se ha definido. Puede cualquier probabilidad de gurús de aclarar las cosas para mí?
EDITAR
Gracias a @Creosota la respuesta de la correcta formulación del programa anual de escape de la probabilidad debe ser en realidad $$ P_{anual} = 1 - \prod_i \left[1 - f(Q_i) \right)^{d_i} $$ Sin embargo, esto cambia mis resultados en el orden de 0.01%, por lo que mi problema no se resuelve (o tal vez el problema no es con la formulación). Yo obtener la descarga de-escape de la curva de este documento. El 13% anual de escape de la estimación para los años 2009--2011, en el documento se basa en marca-recaptura de estudios, y la curva (con 95% de intervalo de confianza) se basa en un multi-modelo de estado los autores generados a partir de los mismos datos (que he obtenido de la curva generada por la descarga-sólo en el modelo, el cual predice ligeramente superior de los escapes que la figura en el papel). Yo uso el embalse de liberación registro para calcular el número de días que una versión es dentro de un "flujo de la banda", por ejemplo, el número de días en el año en que el flujo es de entre 1000 cfs y 1250 cfs. El flujo de las bandas son realmente definido de tal forma que los límites de cada banda lapso de un cambio en el escape de la probabilidad de 0.005%.
Yo no entiendo mucho por encima del 4% para cualquiera de los años, incluso cuando se utiliza el límite de confianza superior de la curva. Reconozco que debe haber alguna discrepancia entre los dos resultados, pero yo en realidad iba a esperar que mi escape de las tasas más altas debido a que el modelo de cuentas para la etiqueta de la pérdida y de la mortalidad. Alguna idea?
EDIT 2
Estoy aceptando la Creosota la respuesta de porque proporciona la forma correcta de la escala de diario anual de la probabilidad. EdM que la respuesta fue también muy útil en señalar que el problema probablemente tiene más que ver con el subyacente el escape de descarga modelo que con el mejoramiento de procedimiento. Voy a publicar otra edición si puedo obtener más información sobre mi problema, pero el día-->probabilidad anual cuestión parece resuelto.