6 votos

Residual y lineales de mínimos cuadrados e Ingeniería de calidad

Quería hacer esta pregunta en stackoverflow, pero creo que es más adecuado aquí. Si estoy equivocado, por favor dígame.

Mi pregunta se refiere a la utilización de la estadística para analizar física/ingeniería de datos. Como herramientas estadísticas para ser utilizado dependerá del contexto y rara vez son universales, es obligatorio que describo mi problema que es bastante largo.

Mi pregunta

En mi caso, ¿cómo debo valorar el residual a considerar lo bueno que son mis pruebas? Debo simplemente comparar sus residual media de los cuadrados (RMS)? O debo comparar la raíz cuadrada de la RMSs? O debo comparar la raíz cuadrada de la suma de los cuadrados de los residuales dividido por el residual grados de libertad? O cualquier otra cosa?

resumen: $$ \frac{\sum_i(Y_i-\widehat{Y})^2}{n-2} o \sqrt{\frac{\sum_i(Y_i-\widehat{Y})^2}{n-2}} o \frac{\sqrt{\sum_i(Y_i-\widehat{Y})^2}}{n-2} o \; ELSE \;? $$ Con el contexto, se entiende por qué no quiero utilizar herramientas estadísticas utilizando la media de $\overline{Y}$ y sólo los residuos.

Configuración

Mi verdadero problema es bastante complejo y análisis de preocupaciones de algunos de física relacionados con los datos de prueba. Así que por el bien de el ejemplo y para evitar ir a la física (que no es nuestro tema aquí): digamos que yo soy un ingeniero de calidad y quiero comprobar la calidad de un conjunto de M muestras por ensayo de tracción. (Elegí el ensayo de tracción porque se enseñó desde el principio en la escuela secundaria y bastante sencillo de prueba)

Mi prueba es simple: me tire de cada uno de mi muestra sólo y estrictamente en el régimen elástico que tiene normalmente una correlación lineal entre la tensión de carga L, Newton) y la tensión a la m (desplazamiento D, en Metros). m es el factor de potencia de desplazamiento y es desconocido. Así que tengo la siguiente ley (1):

$L=a*D^m $ (1)

$1\leq m \leq 2$

nota: para m=1, es la rigidez "k", en relación con su módulo de Young "E", y tengo un típico ensayo de tracción con un ejemplo típico. No es importante si es el caso aquí, pero podría suceder. m debe ser el mismo para todas las muestras de mi pero nunca es estrictamente la misma (ya sabes, experimentos...) y es desconocido.

Mi instrumento ahorra el desplazamiento y la carga de puntos de datos en un $2*n$ matriz, n es el número de puntos de datos. Tengo un total de M muestras, por lo tanto M pruebas.

Objetivo

Mi objetivo es comprobar si cada prueba siga correctamente mi ley (1). Si sí, mi ejemplo es bueno. Si no, mi ejemplo es mala, y puedo basura en la papelera de reciclaje, por supuesto). Cuando se trazan, pruebas en el "malo" de las muestras de mostrar los pasos o varios regímenes de al $L$ vs $D^m$ $\forall m$ (que es claramente visible para ambos casos). el "malo" de las muestras de simplemente decir que hay estructurales valores predeterminados. Para muestras buenas, $L$ vs $D^m$ (con mejor $m$) es una línea sencilla (menos errores inducidos por el instrumento de medición).

Algoritmo

Para encontrar m, yo uso un simple proceso de iteración lineal método de cuadrados mínimos con Matlab. Para $L=0$, $D=0$ de curso (no hay fuerza, no hay tensión). Aquí está el algoritmo simple (no en perfecto lenguaje matlab para mayor claridad!) para una prueba:

[RMS,m,a] = function(D,L) %inputs: Displacement D and load L
                          %outputs: RMS, m and a
Vm=1*101 Vector    %m will have a 0.01 precision.
Vr=1*101 Vector
Va=1*101 Vector
for 1<Vm<2
    X_m = D.^Vm
    Va=X_m\L     %left matrix divide built-in function of matlab: 
                 %Solution by least square method used.
    Vr=sum((L-a*X_m).^2)./(length(L)-2)  %Residual Mean Square calculation
                                         %Note: length(L)=n: number of data points
end for
[RMS, RMSPos]=min(Vr) %RMS = Residual Mean Square = min(r):least residual. 
                      %RMSPos: position in the vector of the least residual
m=Vm(RMSPos)         %Saves the m with the least residual
a=Va(RMSPos)         %Saves the a with the least residual

end function

Y yo que para cada uno de mis M pruebas.

Problema

Ahora quiero definir un método para decir "estas muestras son buenas" o "estas muestras son malos". Me gustaría comparar el $M$ RMS tengo desde el $M$ pruebas: los cercanos a 0 me contaba acerca de las buenas pruebas, los mayores que 0 se me informe sobre los malos. Yo podía decidir de un RMS límite de $RMS_{lim}$ donde $RMS\leq RMS_{lim}$ me daría los buenos ejemplos y $RMS > RMS_{lim}$ me daría los malos ejemplos. En algunos modos, también puede ordenar la "bondad" de todos los de mi $M$ de muestras por ordenar desde el más pequeño de los residuos para los más grandes. De esta manera, no es necesario para comprobar la trama de todos los de mi $M$ pruebas manualmente y ver si tengo una hermosa línea o un feo al azar cosita.

Mientras que definitivamente puedo comparar el RMSs dentro de uno de los ensayos para los diferentes '$m$'s, me pregunto si es a la vez física y matemáticamente aceptable para comparar la RMSs entre las diferentes pruebas. Por qué? Porque, por un lado mi prueba diferentes soluciones similares pero que NO son estrictamente iguales max $L$ (o $L_n$), max $D$ (o $D_n$), '$m$'s, '$a$'s y '$n$s '( $n$ : número de puntos de datos en una prueba). En la parte superior de que la RMS es un cuadrado valor, por lo que probablemente debería comparar la raíz cuadrada de la RMS entre las pruebas. Especialmente si está por debajo de 1...

Qué comparar?


Lado-notas

No puedo utilizar las herramientas de la media, como por ejemplo el coeficiente de determinación, porque sería tomar en cuenta la distancia entre cada punto de datos y la media de todos ellos. La cuestión? Imagínate que yo decida volver a ejecutar una prueba y "olvidar" una $(D_i,L_i)$ par cerrar previamente se calculó la media y tirar un poco más de mi muestra, aún en el régimen elástico, para conseguir una mayor Carga máxima $L_n$. Puedo mantener la misma cantidad de datos (mismo $n$). Lo que sucede? Así, el RMS todavía será aproximadamente el mismo que el de mi ejemplo va a ser todavía intacta (elastic prueba, ¿recuerdas? :) ). Pero el coeficiente de determinación podría acercarse a uno... Que no tiene sentido como mi ejemplo de no convertirse de repente "mejor". He probado experimentalmente para hacerlo seguro.

Entonces: en ninguna manera esto es un método muy utilizado para el filtrado de buena dispositivos de dispositivos dañados. No te preocupes, ningún avión se estrelle o edificio se auto-destruyen debido a un mal ingeniero (me) utiliza un mal método para probar la calidad de sus componentes :) . Yo sólo soy un ingenuo estudiante con muy poco matemático/estadístico fondo de trabajo en un -lugar - tema complejo.

Acuse de recibo

Gracias! A quien pudiera leer este largo texto.

Wli

1voto

Suan Puntos 253

No voy a través de su pregunta completamente, es bastante largo.

Pero creo que se refiere a la bondad de ajuste análisis y regresión múltiples.

Recomiendo lectura capítulo 3 titulado 'Diagnóstico y medidas correctivas' de libro ' modelos estadísticos lineales aplicados '.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X