13 votos

Número de dígitos significativos al informe

Es allí una manera más científica de determinar el número de dígitos significativos de informe para una media o un intervalo de confianza en una situación que es bastante estándar - por ejemplo, el primer año de clase en la universidad.

He visto el Número de cifras significativas para poner en una mesa, ¿por Qué no usar los dígitos significativos y el Número de cifras significativas en una chi-cuadrado de ajuste, pero estos no parecen poner su dedo sobre el problema.

En mis clases trato de explicar a mis alumnos que es un desperdicio de tinta para informar de 15 dígitos significativos cuando tienen un ancho estándar de error en sus resultados - mi sensación fue la de que debe ser redondeado a cerca de algún lugar de la orden de $0.25\sigma$. Esto no es demasiado diferente de lo que se dice por la norma ASTM - Informes de Resultados de la Prueba de referencia para E29 donde dicen que debe ser entre el$0.05\sigma$$0.5\sigma$.

EDITAR:

Cuando tengo un conjunto de números como x a continuación, cuántos dígitos debo usar para imprimir la media y la desviación estándar?

set.seed(123)
x <- rnorm(30) # default mean=0, sd=1
# R defaults to 7 digits of precision options(digits=7)
mean(x) # -0.04710376 - not far off theoretical 0
sd(x) # 0.9810307 - not far from theoretical 1
sd(x)/sqrt(length(x)) # standard error of mean 0.1791109

PREGUNTA: explicar en detalle lo que la precisión es (cuando hay un vector de números de precisión doble) para la media y la desviación estándar en este y escribir una simple R función pedagógica que imprime la media y la desviación estándar para el importante número de dígitos que se refleja en el vector x.

10voto

Uaithne Puntos 21

La Guía de la Incertidumbre de Medida (GUM) recomienda que la incertidumbre ser informado de, con no más de 2 dígitos y que el resultado será reportado con el número de dígitos significativos que se requieren para hacerla coherente con la incertidumbre. Ver

http://www.bipm.org/utils/common/documents/jcgm/JCGM_100_2008_E.pdf

El código siguiente fue mi intento de poner en práctica esta recomendación en R. Noe que R puede ser que no coopera con los intentos de conservar los ceros a la derecha en la salida, incluso si son significativos.

gumr <- function(x.n,x.u) {
  z2 <- trunc(log10(x.u))+1
  z1 <- round(x.u/(10^z2),2)
  y1 <- round(x.n*10^(-z2),2)
  list(value=y1*10^z2,uncert=z1*10^z2)
}

x.val <- 8165.666
x.unc <- 338.9741
gumr(x.val,x.unc)

6voto

John Richardson Puntos 1197

Si muestra el intervalo de confianza, así como el valor de la estadística, entonces no hay ningún problema con dar tantas cifras significativas como usted desea, como en este caso un gran número de cifras significativas no implica espurias de precisión como el intervalo de confianza nos da una indicación de la probabilidad real de precisión (un intervalo creíble sería mejor). Es entonces esencialmente una cuestión de hacer la tabla ordenada, concisa y legible, así que, esencialmente, no es probable que haya una regla simple que se adapta a todas las ocasiones.

Replicabilidad es importante en los estudios científicos, por lo que idealmente debería ser posible reproducir los resultados a cualquier número de siginifcant figuras (si son de importancia en la práctica o no). Redondeo a un pequeño número de cifras significativas puede reducir la confianza en una réplica de un estudio, ya que los errores podrían ser enmascarados por el redondeo de los resultados, así que hay una posible desventaja de redondeo en algunas circunstancias.

Otra razón para no redondear demasiado lejos, es el que puede hacer que sea imposible para los demás para ampliar su estudio sin llegar a repetirla. Por ejemplo yo podría publicar un trabajo que compara diversos algoritmos de aprendizaje automático mediante el test de Friedman, que depende de la clasificación de los diferentes algoritmos en un conjunto de referencia de los conjuntos de datos. Si las estadísticas individuales de los clasificadores en cada conjunto de datos se dan a un número de cifras significativas en función de sus errores estándar, lo que sin duda crear muchos vínculos aparentes en la clasificación. Esto significa que (i) un lector/revisor del documento será incapaz de replicar el test de Friedman a partir de los resultados dados en el papel y (ii) a alguien más, entonces sería incapaz de evaluar su algoritmo en el punto de referencia de los conjuntos de datos y utilizar el test de Friedman para ponerlo en el contexto de los resultados de mi estudio. Generalmente, el uso de suficiente signfiicant cifras para evitar la introducción de falsos lazos de no causar un problema para el lector.

4voto

gauss Puntos 110

Seguramente cualquier decisión, hecho objetivamente o subjetivamente, fuertemente dependería de lo que usted está midiendo y cómo exacto es el instrumento de medición. Este último es sólo una parte de la variación observada y no siempre es fácil discernir o encontrar evidencia para. Así sospecho fuertemente que no hay ningún objetivo, decisión universalmente aplicable. Sólo tienes que usar tu cerebro y hacer el mejor juicio en cada situación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X