5 votos

Significado estadístico en el papel del exceso de bosón Z

En un reciente artículo de ATLAS , un exceso de $3\sigma$ de la predicción del Modelo Estándar en una búsqueda de una señal de dileptón del mismo signo con una masa invariante alrededor del pico Z. Por razones de brevedad, discuto sus resultados en el canal del electrón.

Sus resultados se muestran en la tabla 7 del documento, en la que citan un $16$ eventos con un fondo esperado en $4.2 \pm 1.6$ . El cuadro completo se muestra a continuación: enter image description here

Este resultado por sí solo sugiere ingenuamente una desviación del SM de $7.4\sigma$ !. Sin embargo, en lugar de utilizar esta estimación, ATLAS utiliza pseudoexperimentos para comprobar "con qué frecuencia se produciría tal desviación del SM". Los resultados de este método se muestran en la tabla 11, enter image description here Encuentran un fondo de $8 ^{+4}_{-2}$ que se trata de $3\sigma $ lejos de su observación, $20$ .

Me gustaría entender por qué era necesario este segundo paso. En esencia, están dejando de lado su técnica de estimación de fondo basada en datos para estimar su discrepancia. Sin embargo, el enfoque basado en los datos es el que uno esperaría ingenuamente que fuera más preciso.

¿Están tratando simplemente de ser conservadores o hay una buena razón por la que se requiere el segundo enfoque?

2voto

AdrieanKhisbe Puntos 113

Permítame comenzar con su ingenua estimación de la importancia. Dieciséis ( $o=16$ ) sobre un fondo esperado de $b=4.2\pm1.6$ . Supongo que ha calculado que $$ \frac{o - b}{\delta b} \simeq 7.4, $$ concluyendo que el exceso tiene una importancia de $7.4\sigma$ . Hay dos errores principales en esta interpretación de los datos y del cálculo.

En primer lugar, en la hipótesis de sólo fondo, esperamos que el número de eventos observados, $o$ para que se distribuya como Poisson con la expectativa $b$ . El error $\delta b=1.6$ es la incertidumbre sobre la expectativa de una distribución de Poisson; no es la desviación estándar del número de eventos observados. Nótese, sin embargo, que como el fondo se estima a partir de un experimento de recuento subsidiario, $\delta b$ contiene un componente sistemático y estadístico.

En segundo lugar, no conocemos las distribuciones. Incluso si se sabe que un resultado fue $7.4$ desviaciones estándar lejos de lo que esperábamos, no se podía averiguar la importancia del exceso. Las desviaciones estándar sólo especifican un contenido de probabilidad si se especifica una distribución concreta. No se conoce la distribución, y si se quiere conocer la probabilidad en la cola de una distribución, como se hace con las significaciones, hay que tener cuidado.

En resumen, ATLAS no parece estar haciendo las cosas dos veces o alterando su procedimiento estadístico a la luz del gran exceso. Están calculando la significación una vez de la forma habitual mediante Monte Carlo, teniendo en cuenta la información completa sobre las incertidumbres y sus distribuciones, y la naturaleza poissoniana inherente a su experimento de recuento.

Este es un problema estadístico clásico que se da en física, a veces denominado "problema de encendido/apagado". Si se apunta un detector a una fuente ("on") y se mide una tasa, y luego se apunta el detector lejos de esa fuente ("off"), ¿cómo se hace una inferencia estadística sobre el efecto de la fuente? Véase Cousins y otros para un debate.


Un tercer punto, $S^{95}$ indicar $95\%$ límites máximos de las cantidades, en lugar de las cantidades mismas. Yo no intentaría estimar la significación a partir de estas cantidades (de nuevo, no se conocen las distribuciones, etc.), pero no es tan sorprendente que se acerque al resultado del cálculo completo. El error en el cálculo esperado $S^{95}$ es $95\%$ cobertura en repetidos pseudoexperimentos - incluyendo los errores en los fondos y la naturaleza poissoniana de los mismos.

1 votos

Estoy bastante inseguro sobre tu afirmación sobre la incertidumbre de Poisson. En el artículo, el pie de foto menciona que las incertidumbres mostradas en la tabla de OP contienen tanto incertidumbres estadísticas como sistemáticas. Así que esperaba que las incertidumbres citadas en la tabla fueran la RMS de la PDF completa (un producto de Poisson y tantos Gaussianos como sea necesario para los muchos parámetros molestos).

0 votos

@MichaëlUghetto las estimaciones de fondo se basan en datos. contienen una incertidumbre sistemática y estadística.

0 votos

Gracias por su respuesta. Todavía estoy tratando de entender esto. Lo que me confunde es que, según lo que dices, parece que la estimación del fondo basada en datos es efectivamente inútil, ya que no se utiliza para estimar las discrepancias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X