4 votos

Correlación entre series (optimización informática)

Objetivo: Obtener la línea roja a ir tan alto como sea posible.

Puedo controlar los valores de las líneas verde y naranja. Hay como 50 otras líneas que puedo controlar y puede hoyo en contra de la línea roja.

Lo que es una buena manera de determinar qué líneas están correlacionados con el movimiento de la línea roja?

Por ejemplo:

  • Las líneas que tienden a ir hacia arriba cuando la línea roja va?
  • Las líneas que tienden a ir hacia abajo cuando la línea roja va?
  • Las líneas que parecen tener un "valor óptimo" para la línea roja (algo más alta o más baja se correlaciona con la línea roja de no ser tan alto)

¿Hay algún tipo de análisis matemático que se puede ejecutar en contra de la serie para obtener respuestas a estas preguntas?

Para cualquier programadores, estoy usando JavaScript y Python, por lo que cualquier bibliotecas en las lenguas que podría ser útil también.

Más información de fondo

Esta pregunta se aplica a una horizontal a escala super sistema de computación. La línea roja es el sistema está siendo realizada por minuto.

La línea verde es la base de datos de tiempo de respuesta para una determinada operación. Así que si la base de datos tiempo de respuesta que la línea verde representa es baja cuando la línea roja es alta y alta cuando la línea roja es baja, entonces sé que tengo que mirar en para optimizar el tiempo de respuesta de la base de datos.

La línea naranja representa el número de subprocesos que se ejecutan en el sistema. Obviamente, demasiado pocos hilos que significa menos va a hacer, pero también sospecho que muchos de los hilos de mayo de consejo directivo el sistema, así que sería genial ser capaz de saber si hay un "óptimo" valor para el número de subprocesos que se ejecutan en el sistema.

Muchas gracias!

enter image description here

2voto

Nick Sergeant Puntos 3792

"Lo que es una buena manera de determinar qué líneas están correlacionados con el movimiento de la línea roja?"

Usted puede tratar de crear diagramas de dispersión, donde en el eje x se tiene "línea roja" y en el eje de las variables que desea de la prueba de correlación. Usted puede ver visualmente si tienen lineal, monótona, otra o ninguna correlación.

Si usted tiene los datos escritos en una matriz o un marco de datos, donde cada columna es una variable y cada fila es una observación, se puede aplicar de Pearson o de Spearman de correlación de la prueba.

Aquí es un ejemplo, usted puede hacer uso de R:

red_line = c(0.7, 0.8, 0.9, 0.7, 0.3, 0.9, 0.5, 0.4, 0.3, 0.2)
orange_line = c( 0.6, 0.7, 0.8, 0.9, 0.9, 1.0, 1.1, 1.2, 1.3,1.4)

df = data.frame(cbind(red_line,orange_line))
attach(df)
plot(red_line,orange_line,xlim = c(0,2), ylim=c(0,2))
cor.test(red_line,orange_line, method =  c("pearson"))
cor.test(red_line,orange_line, method =  c("spearman"))

Aquí es una respuesta de @mbq, en el que se explican cuando el uso de Pearson o de Spearman.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X