7 votos

Error en la estimación con datos continuos

Es allí una manera de correlacionar el error en un ajuste (MSD - desplazamiento cuadrático medio) para el error de un cálculo realizado con los parámetros asociados con el ajuste?

Mi problema es tratar con los datos espectroscópicos. Sé que muchas personas utilizan técnicas espectroscópicas para la estimación de las concentraciones de los diferentes materiales, pero me gustaría saber cómo exacta de estas mediciones puede ser (es decir, me gustaría tener una salida algo así como "especies de Una es $20\% \pm 1\%$ de la muestra dado"). Además, me gustaría saber cómo lidiar con casos muy extremos, donde varios diferentes tipos de materiales están presentes, y pueden tener características observables que recaen directamente sobre la parte superior de uno al otro.

Un ejemplo sencillo puede ser el siguiente:

Usted puede ver que hay dos especies que se ajuste a los datos. Si las áreas son transformadas por el cálculo en porcentajes, (es decir, la muestra tomada es de 48% B, 52% A) ¿cómo podemos estar seguros de esto y qué tan preciso es el ajuste? Sé que esto va a depender de la precisión de la estimación de la posición de los picos que (tal vez) dado por el usuario, por lo que estoy interesado en un método que toma un conocido error en los parámetros (por decir $\pm 15$ sobre el eje x para el error en el pico de la posición de centro, +-10 error en la anchura del pico, etc.).

Tengo la sospecha de que los errores se convierten en grandes cuando los objetos se superponen (es decir, el pico de los centros para dos funciones de ajuste son los mismos).

Además, es posible que estos espectros tienen un gran fondo, que también puede tener error, afecta a todas las otras especies y sus errores. No estoy seguro de si este fondo sería tratada de manera diferente a todas las otras especies, o si pudiera ser tratada dentro de un mismo algoritmo, como todos los de las otras especies.

Para ilustrar mi punto, aquí hay una imagen de un espectroscópicas medición de una serie de diferentes materiales:

[image](http://imgur.com/3mO80Bj)

En la parte superior en rojo son los datos crudos dados por absorción óptica (los datos medidos), mientras que el negro es un calculado de fondo, y el azul es un calculado de la suma de todas las especies, incluyendo el fondo.

En la parte inferior, el valor calculado de fondo se resta (azul y rojo líneas que ahora NO incluyen el valor calculado de fondo), mientras que las diferentes líneas de colores a continuación son cada una de las especies individuales se suman para crear la línea azul.

Estas son las mediciones calculadas estoy interesado en estimar el error.

Como se puede ver, el error es enorme en este ejemplo para la mayoría de las mediciones calculadas. Cada especie puede o no puede tener varios picos asociados con ella, que puede ser ilustrado por la negrita de color amarillo calculado línea. Además, se puede ver que varios de los pico calculada centros de otoño alrededor del mismo lugar, así que es probable que esto reduzca la certeza de que las mediciones son correctas, incluso si la línea calculada cae directamente sobre los datos en bruto.

He calculado el desplazamiento cuadrático medio como una rápida estimación de la calidad del ajuste es, pero sé que este no hace nada para abordar cualquiera de las grandes preocupaciones de la real calculado incertidumbre de la medición. La mayoría de los que me han hecho realmente en las estadísticas es la desviación estándar y los cálculos de lidiar con varias medidas, pero esto es muy diferente, ya que se ocupa de la manera de asegurarse de que usted puede ser con sólo una medición, no ver las diferencias en las medidas múltiples. Es que este problema se resuelva el uso de intervalos de confianza y los niveles de confianza? (De nuevo, soy muy nuevo en estadísticas y nunca ha tomado un curso en él, así que pido disculpas si este es primaria o trivial)

-1voto

PsycStats Puntos 44

Los siguientes pasos le ayudarán a calcular un estimado del término de error en los datos continuos. Aunque yo se ocupan principalmente de la psicología de la investigación, creo que usted está buscando para calcular un término de error e intervalo de confianza. Aquí hay un ejemplo que he adaptado de algún otro lugar, pero muestra el paso a paso el cálculo de un intervalo de confianza 95%.

Supongamos una muestra de 30 (n=30), y que su puntuación media es x=118.3, con una desviación estándar de 11.4 (SD=11.4). Así que vamos a encontrar el intervalo de confianza 95% para la media de población.

Definición de términos: a) α = 1 - grado de confianza (usted puede elegir .95, .99, etc.) , por lo que el 1 - .95 = .05. b) sea t(α/2) ser el t-valor para una de dos colas de la distribución. c) x es la media de la muestra.

Así, Paso 1: El error máximo es: Error = t(α/2) * SD/sqrt(n)

Sabemos que SD = 11.4 y n = 30, pero tenemos t(α/2).

Paso 2: Para encontrar t(α /2), nos fijamos en la tabla de distribución t de Student (si la muestra (n) es mayor que 30 se podría utilizar el estándar de t de la tabla de distribución) con .05 en dos colas y con 29 (n-1 o 30-1) grados de libertad. Tenemos 2.045. Usted puede encontrar esta tabla en línea o en la parte posterior de la mayoría de las estadísticas de los libros de texto.

3) Ahora, de vuelta a nuestra fórmula en el paso 2. E = 2.045 *11.4/Sqrt(30) =4.256

4) por último, el intervalo es: x + o - E = 118.3 + 4.256 y E = 118.3 - 4.256

Ahora se podría decir que 95 de cada 100 veces la puntuación media caería en algún lugar entre 114.044 a 122.556 de la puntuación media.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X