6 votos

Poniendo un intervalo de confianza sobre la media de un acontecimiento muy raro

Estoy simulando un evento extremadamente raro (la detección de la ponderación de los fotones de los paquetes en un material muy absorbente). Por ejemplo, puede simular la transmisión de 1e9 fotones y detectar solamente 10 de ellos (y sus pesos varían de $0^+$ a 1). Estoy calculando el valor medio de esta ocurriendo (¿cuál es la media de $\sum w_{received}/N_{transmitted}$ donde $w_{received}$ es el peso de los fotones recibidos y $N_{transmitted}$ es el número de fotones transmitidos) y poner un intervalo de confianza de este. Mi entendimiento es que la media de población, $\mu$ se encuentra dentro de una Normal estándar desviación de $\bar{x} \pm S_N/\sqrt{N}$ donde $\bar{x}$ es la media de la muestra, $S_N$ es la varianza de la muestra, y $N$ es el número de muestras.

Mi pregunta es la siguiente, ¿cómo puedo saber si he recibido suficiente "positivo" de la muestra, o recibido de los fotones, para obtener una estimación más precisa? Desde que estoy tratando con una pequeña probabilidad, el número total de muestras, $N$ es muy alto, y $S_N/\sqrt{N}$ siempre será pequeño. He visto las notas diciendo que el CLT sólo se mantiene para muestras de tamaños > 30, pero que se aplican a algo como esto? es decir, $N_{received}$ > 30?

Resumen: estoy dibujando muestras de un desconocido la distribución y la informática de su media. Muestra el rango de valores de 0 a 1, donde 0 es mucho más común. Estoy calculando la media (que es muy cercano a 0) y quiero poner un intervalo de confianza de este.

Edición De mi descripción anterior, hay dos maneras de pensar el problema. La primera es una distribución binomial de sí/no de resultados (sí, recibido; no, no ha recibido). Sin embargo, el más complejo, y en la práctica, más útil, la distribución es un poco de un promedio ponderado de la binomial (no estoy seguro si ese es el término correcto), donde recibieron cada fotón "paquete" tiene una energía asociada con ella, que va de 0 a 1. Que es el caso que más me importa poner un intervalo de confianza. es decir, mi ejemplo de valores, predominantemente ser 0 con un pequeño número de muestras con valores 0 < x <= 1

Edit 2 El PDF será algo parecido a la cruda dibujo de abajo. Tenga en cuenta que no está a escala - no será mucho más de 0 pesos que los no-cero pesos. Este es un ejemplo de pdf de muestras. No sé lo que esto se verá como antes de hacer un experimento - yo sólo sé que mis muestras en el rango de 0 a 1, con un predominan cantidad 0.

Example PDF of sample values

Edición 3 El término "peso" parece ser un poco engañoso. "Ejemplo de valor" o "poder" puede ser un término mejor. Mi simulación pistas de fotones de movimiento a través del agua. La mayoría de los fotones nunca llegar al receptor y por lo tanto tienen una potencia de 0. Como los fotones se mueven a través del agua su potencia es reducida (para modelo de un grupo de fotones en movimiento con una porción de ser absorbida a medida que se mueve a lo largo). Como estos fotones son recibidos tienen pesos que van desde un máximo de 1 (ninguna pérdida de los viajes) hacia abajo en dirección a un número se aproxima a 0.

3voto

Auron Puntos 2123

La aproximación normal para el intervalo de confianza de proporciones binomiales se rompe muy mal para eventos raros y las reglas de pulgar sobre los tamaños de muestra son inconsistentes y poco fiables. Los mejores métodos son tan fáciles de calcular (es decir, usted haga clic en el botón!) y lo que no hay razón para cualquier persona el uso de la aproximación normal. Nunca.

Un vistazo rápido a los documentos a continuación (y, a continuación, utilizar Wilson método).

Vollset. Los intervalos de confianza para una proporción binomial. Estatismo. Med. (1993) vol. 12 (9) pp 809-24 Brown et al. El intervalo de la Estimación de una Proporción Binomial. Estadísticas de la Ciencia (2001) pp 101-117 http://www.jstor.org/stable/2676784

Ver también algunas preguntas previas a esta lista: Cómo informar asimétrica de los intervalos de confianza de una proporción y Funciones discretas: intervalo de Confianza de la cobertura? y una Aclaración sobre la interpretación de los intervalos de confianza?

1voto

Auron Puntos 2123

Ahora que está claro que tiene una función de ponderación, le sugiero que use Bayesiano intervalos (a menudo llamados intervalos de credibilidad) con la función de ponderación de ser la anterior. Multiplique el resultado por la probabilidad de la función proporcionada por los resultados para obtener la parte posterior. Cualquier intervalo que contiene el 95% del área bajo que la distribución posterior es de un 95% intervalo creíble.

La función de probabilidad se calcula fácilmente: comenzar con un uniforme (0,1) indicando que no hay datos, y así no hay evidencia. Para cada uno de los fotones recibidos de multiplicar la distribución por y=x, y para cada uno de los fotones se envía pero no recibe lo multiplicamos por y=1-x. Cuando usted ha hecho que todos los fotones enviado usted tendrá la función de probabilidad que representa la evidencia inherente a los datos. Puede escalar a un máximo de 1 para buscar los convencionales, si te gusta. [Por supuesto, y representa la probabilidad de x es el hipotético probabilidad de éxito en cada ensayo.]

Existe una fórmula para la probabilidad de la función, pero me resulta más fácil de comprender en la manera en la que he expresado aquí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X