5 votos

¿Cómo se comportan los errores de medición en los escasos datos?

De educación no estadístico busca la relación a corto plazo para muy unilateral beneficio.

El sistema en cuestión consiste en rocas y propiedades físicas. La modelización de los bits de la tierra normalmente significa que algunas mediciones reales en comparación con el volumen de modelo. Muchas estimaciones son necesarios, y NO tengo IDEA de cómo manejar la declaración de incertidumbres. Para ilustración digamos que el flujo del proceso de modelización de la 'medida pequeña muestra de las rocas: obtener la propiedad X (a través de la media de las mediciones)', 'uso de la X en el modelo simple para determinar Y'. E. g., Y = mX + b. Si tengo 20 rocas que yo medida, y obtener un medio para la propiedad X, ¿cómo puedo mostrar su incertidumbre al principio, y entonces, ¿cómo hago para que se propagan a través de mi cálculo de Y (suponiendo que la incertidumbre en torno al m es insignificante en comparación)?

He mirado en mi gráfica de los datos, y que parecen tener, en su mayoría forma Gaussiana. E. g. este es un gráfico de el kernel de densidad de la propiedad X:

image kernal

Algunos sesgo y el desnivel evidente, posiblemente afectada por el tamaño pequeño de la muestra. OK, así que hay una muy gran dispersión de valores para algunos de los tipos de rocas, pero en esencia nos lidiar con grandes volúmenes, y tienen que idealizar nuestros modelos un poco, así que las colas como se puede ver en la curva amarilla extremo izquierdo, mientras que el real, no va a ser explorado en nuestras simulaciones numéricas. Una vez me dijeron que por un antiguo pro que si mi modelo puede explicar aproximadamente el 85% de las observaciones, a continuación, debo comprar champagne.

Este: la Estimación de error de mediciones repetidas parece ser una pregunta similar, pero no la puedo incluso entender realmente el aceptado respuesta. Std dev/sqrt(n) es el estándar de error'?

4voto

goodsamaritan Puntos 56

Su problema tiene en realidad tiene dos partes principales.

La primera está relacionada con las estadísticas. Usted tendrá que evaluar los datos a la luz de su conocimiento del sistema y la opción para que coincida con diferentes distribuciones para confirmar el tipo de datos que usted tiene es un buen primer paso. Una vez que usted tiene un buen modelo a continuación, puede comenzar a hacer llamadas como la mejor forma de analizar - es decir, usted puede conseguir lejos con distribución normal tipo de análisis por ejemplo, utilizando una simple significa o qué es necesario para utilizar la mediana o la distribución que indica que hay más complejidades subyacentes.

Esto nos lleva al segundo punto - probablemente más en mi área de especialización - esto es si usted tiene suficiente de muestra. No me estoy refiriendo a la estadística contexto (tipo de) de una muestra, pero en realidad el geológica y/o evaluación metalúrgica de minerales muestra representativa. Como metalúrgico/procesamiento de minerales ingeniero, generalmente se trata de un desafío mayor que el de las estadísticas. Si usted no ha logrado obtener el tipo correcto de la muestra que se podría detener!

Para confirmar que usted tiene una muestra de la relevancia, usted tendría que considerar las cosas de muestreo práctica para su comodidad. Por ejemplo, si usted está buscando para comprender la distribución de la densidad de partículas de un cuerpo mineral usted necesita una gran cantidad de la muestra a la que comienzan a representar el todo. Sospecho que, dado que usted está buscando en partículas, que son más propensos tratando de entender la densidad de discretos minerales, Probablemente en una insitu contexto, pero esto probablemente no es el foro para entrar en detalle acerca de eso! Puedo recomendar saltando en LinkedIn foro en el muestreo de los cuerpos minerales, si usted desea más en esta área.

Para aquellos no familiarizados con la mineralogía, la cuestión es que el análisis de partículas no permite la selección de poblaciones discretas. Esto significa que hay una gran cantidad de confusión de los datos asociados a los minerales y la elección sobre dónde obtener la muestra.

Espero que esto ayude.

Marca

1voto

JMW.APRN Puntos 21

Como se ha mencionado en los comentarios, la pregunta es un poco vaga así que es duro para asegurarse de que me conteste.

Si su propiedad X es la media de veinte medidas, entonces se puede calcular la desviación estándar a partir de esa muestra, decir σ. Si usted cree que las mediciones son independientes, la desviación estándar de X σ / √20.

Entonces la pregunta es si m es una constante o si en realidad se desea estimar a partir de los datos. Si es una constante, entonces la desviación estándar de Y es m σ / √20. Si usted realmente tiene un problema de regresión, como tratando de adaptarse a m y b y, a continuación, utilizar ese modelo para predecir Y a partir de X, es probablemente mejor usar todos los puntos de datos (un promedio). A continuación, la variación es mucho mayor y dependerá del valor de X. Si X es Gaussiano usted puede buscar la fórmula de la Wikipedia , en el apartado "Normalidad asunción".

A mi conocimiento, no existe un método general para propagar la incertidumbre, que significa que usted tendrá que trabajar su camino a través de cada problema. Para convencer a los que voy a utilizar un patológicos caso. Si X tiene una distribución uniforme entre 0 y 1 (varianza 1/12), luego bronceado(π(X - 1/2)) tiene una distribución de Cauchy y por lo tanto una infinita variación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X