8 votos

Análisis de incertidumbre y sensibilidad

Tengo el siguiente problema:

Dado entradas $x$ ($n$-dimensiones del vector) de escalares, ordenó a los números enteros y no están ordenados de enteros (es decir, las etiquetas) y una o varias salidas de $y$, me gustaría como para estimar:

  1. Las entradas que explican la mejor de las salidas.
  2. En qué medida las variaciones de una entrada implica variaciones de las salidas.

Se supone que esta es relativa a la incertidumbre y análisis de sensibilidad, que son bastante amplios campos. ¿Sabes de métodos y recursos con un enfoque relacionado con mi problema?

18voto

Paul Puntos 546

Usted puede tratar de una de las herramientas que se proporcionan aquí. Que es matlab soluciones, muy buen código y de los métodos modernos. En primer lugar me gustaría sugerir que usted pruebe las herramientas gráficas de la biblioteca para dar sentido a los datos.

Cuando no se proporcionan los detalles sobre lo que usted necesita aquí están algunos comentarios sobre los métodos implícita:

El Análisis De Sensibilidad Global. El análisis de sensibilidad Global es el estudio de cómo la incertidumbre en el resultado de un modelo (numéricos o de otro tipo) pueden ser aplicados a diferentes fuentes de incertidumbre en el modelo de entrada. Global podría ser innecesario especificación de aquí, de no ser por el hecho de que la mayoría de los análisis se reunieron en la literatura son locales o de un factor-en-un-tiempo.

Monte-Carlo (o Muestra) basado en el Análisis. Monte Carlo (MC), el análisis se basa en la realización de evaluaciones múltiples seleccionados aleatoriamente modelo de entrada y, a continuación, utilizando los resultados de estas evaluaciones para determinar tanto la incertidumbre en las predicciones del modelo y se entregase a los factores de entrada su contribución a la incertidumbre. Un MC análisis consiste en la selección de rangos y distribución para cada factor de entrada; la generación de una muestra de los rangos y las distribuciones especificadas en el primer paso; la evaluación del modelo para cada elemento de la muestra; el análisis de incertidumbre y análisis de sensibilidad.

Metodología De Superficie De Respuesta. Este procedimiento se basa en el desarrollo de una respuesta de la superficie de aproximación al modelo de bajo consideración. Esta aproximación se utiliza como un sustituto para el modelo original en la incertidumbre y análisis de sensibilidad. El análisis consiste en la selección de rangos y distribución para cada factor de entrada, el desarrollo de un diseño experimental la definición de las combinaciones de los valores de factor sobre el que evaluar el modelo, las evaluaciones de la modelo, la construcción de una superficie de respuesta aproximación al modelo original, el análisis de incertidumbre y análisis de sensibilidad.

Detección De Diseños. Factores de análisis puede ser útil como un primer paso cuando se trata de un modelo que contiene un gran número de factores de entrada (cientos). Por factor de entrada, nos referimos a cualquier cantidad que se puede cambiar en el modelo antes de su ejecución. Este puede ser un modelo de un parámetro o una variable de entrada, o un modelo de escenario. A menudo, sólo algunos de los factores de entrada y agrupaciones de factores, tienen un efecto significativo en el modelo de salida.

Local (Análisis Diferencial). Local SA investiga el impacto de los factores de entrada en el modelo a nivel local, es decir, en algún punto fijo en el espacio de los factores de entrada. Local SA es normalmente llevado a cabo mediante el cálculo de derivadas parciales de las funciones de salida con respecto a las variables de entrada (análisis diferencial). Con el fin de calcular la derivada numérica, los parámetros de entrada son muy variadas dentro de un pequeño intervalo de alrededor de un valor nominal. El intervalo no está relacionada con nuestro grado de conocimiento de las variables y normalmente es el mismo para todas las variables.

FORMULARIO-SERM. FORMA y SERM son métodos útiles cuando el analista no está interesado en la magnitud de Y (y, por tanto, su potencial de variación), pero en la probabilidad de Y superando en algunos valor crítico. La restricción (Y-Ycrit < 0) determina un host de hyper-superficie en el espacio de los factores de entrada, X. La distancia mínima entre algún punto de diseño para X y el hiper de la superficie es la cantidad de interés.

Buena suerte!

2voto

cpcat Puntos 11

Para abordar la primera pregunta, le sugiero que eche un vistazo en el análisis de correlación canónica y una más reciente de la dimensión técnica de reducción de llamada en rodajas inversa de regresión. Sobre esto, véase el documento inicial por Ker Chau Li

Rodajas inversa de regresión para la reducción de dimensiones (discusión). Diario de la Asociación Americana de Estadística, 86(414):316-327, 1991.

Es de libre disposición en Internet. La versión con el (muy interesante) comentarios que usted podría tener que comprar el pensamiento.

Algunos parámetros importantes para la elección de un método en que situación están :

  • dimensionalidad de la entrada (n=3, n=15 y n=50 son muy diferentes de los problemas);
  • el tiempo necesario para obtener una evaluación (0.1 s, 5 min y 5 horas también son muy diferentes de los problemas);
  • las suposiciones que usted puede hacer acerca de su modelo : es lineal ? es monótono ?

También se menciona una posible multivariante de salida. Si usted tiene un par de ellos que representan cosas completamente diferentes, acaba de hacer varias independiente de análisis de sensibilidad.

Si están altamente correlacionados o funcionales, a continuación, también el cambio de la problemática mucho.

Usted debe hacer todos estos puntos claros antes de ir para una determinada metodología.

2voto

RAVI CHAWLA Puntos 1

Usted puede ser capaz de utilizar una varianza basado en el análisis de sensibilidad global enfoque para responder a la segunda pregunta. De acuerdo a Saltelli (2008), el análisis de sensibilidad es

"...el estudio de cómo la incertidumbre en el resultado de un modelo puede ser dirigido a las diferentes fuentes de incertidumbre en el modelo de entrada..."

Los enfoques, tales como los mencionados en el Saltelli libro, que normalmente se centran en la primera generación de una entrada de la muestra, que posteriormente se ejecuta a través de un modelo para la generación de resultados y, a continuación, analizó. La salida de las métricas que resultado, como en el total del índice de sensibilidad a la $S_{t_i}$ y de primer orden de índice de sensibilidad a la $S_i$ representan el principal efecto de la contribución de cada factor de entrada a la varianza de la salida. La varianza de los enfoques basados en descomponer la varianza de la salida. Ellos son computacionalmente exigente, y requiere una entrada específica de la muestra.

Para sus propósitos, dado que tiene un rancho de datos es un método alternativo que se propone por parte de Delta Momento Independiente de la Medida (Borgonovo 2007, Plischke et al. 2013) e implementado en la biblioteca de Python SALib.

El código siguiente, tomado del ejemplo permite generar los índices de sensibilidad a partir de los datos existentes:

from SALib.analyze import dgsm
from SALib.util import read_param_file

# Read the parameter range file
problem = read_param_file('../../SALib/test_functions/params/Ishigami.txt')

# Perform the sensitivity analysis using the model output
# Specify which column of the output file to analyze (zero-indexed)
Si = dgsm.analyze(problem, param_values, Y, conf_level=0.95,     print_to_console=False)
# Returns a dictionary with keys 'vi', 'vi_std', 'dgsm', and 'dgsm_conf'
# e.g. Si['vi'] contains the sensitivity measure for each parameter, in
# the same order as the parameter file

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X