6 votos

¿Cómo puede el "anti-correlación" entre estas dos curvas se muestran?

Estoy mirando de datos definido por una característica determinada con respecto a dos de las medidas. Mientras que ambas medidas son definidos sobre el mismo dominio, ambas medidas son definidas en diferentes rangos, por lo que, con vistas a la visualización de ambas curvas en la misma parcela, se han normalizado (suma de a uno por todo el apoyo como una función de densidad de probabilidad).

Two measures defined on same feature.

A partir de la visualización, se puede observar una "alternancia de picos" patrón entre ambas medidas. Esto es interesante porque la teoría de la hipótesis de que la medida representada por la curva azul tiene un inhibidor o efecto de silenciamiento en la medida representada por la curva roja.

Scatter Plot of Curve Values

En algunos aspectos, alternando estos picos pueden ser considerados anti-correlacionada con el uno al otro; sin embargo, los anti-correlación en esta dispersión no parece especialmente fuerte. Del mismo modo, un modelo de regresión no se ve particularmente apropiado en este caso, como el gráfico de dispersión de la muestra. La relación no parece ser evidente.

Hay una mejor manera de capturar y cuantificar la alternancia de los picos de patrón presente entre las dos medidas en los datos?

Editar:

Como se ha mencionado en los comentarios, en la siguiente tabla se muestra los datos construidos a tener propiedades similares a la de los datos originales de más de un dominio más corto.

             Coordinate Measure1 (Blue Curve) Measure2 (Red Curve)
 1           1            0.01190476           0.01369863
 2           2            0.01190476           0.01369863
 3           3            0.01190476           0.01369863
 4           4            0.02380952           0.02739726
 5           5            0.15476190           0.01369863
 6           6            0.15476190           0.02739726
 7           7            0.11904762           0.05479452
 8           8            0.00000000           0.08219178
 9           9            0.00000000           0.10958904
 10         10            0.00000000           0.10958904
 11         11            0.00000000           0.10958904
 12         12            0.00000000           0.10958904
 13         13            0.00000000           0.10958904
 14         14            0.03571429           0.06849315
 15         15            0.15476190           0.04109589
 16         16            0.14285714           0.02739726
 17         17            0.15476190           0.02739726
 18         18            0.02380952           0.02739726
 19         19            0.00000000           0.01369863
 20         20            0.00000000           0.00000000

6voto

erik Puntos 3923

Una curva casi se parece a la derivada de la otra y, a veces, dichos pares de curvas se trazan uno contra el otro con la curva de conexiones. Por ejemplo, para representar la velocidad frente a la aceleración para ver los ciclos de la mejor. Aquí es de color rojo y azul para su juguete de datos:

enter image description here

Las flechas y las anotaciones se añaden a veces. No sé lo que estos tipos de parcelas se llama propiamente. He escuchado "la fase de plano" diagramas, pero ese término incluye una gran cantidad de otros tipos de parcelas, demasiado.

Los puntos de datos están conectados en este caso. Con más y más ruidoso de datos, probablemente desee algún tipo de interpolado de la curva que se va cerca de cada punto.

Actualización: En caso de que no se puede ir sin decir, no estoy seguro de lo que quieres decir por "anti-correlación". Estoy pensando que te quiero mostrar una relación entre dos curvas que no es funcional en el sentido usual de la palabra. Para el gráfico que he mostrado, usted puede pensar en él como paramétrico de la parcela en la que cada variable (azul y rojo) es una función de un parámetro ("Coordenada" en la tabla).

Para la comparación, aquí otra aplicación de este tipo de diagrama de un NYT gráfico en los precios de la gasolina.

enter image description here

0voto

user3780968 Puntos 281

La trama de una medida en contra de la otra (@xan de la respuesta) es una buena idea, excepto que creo que no tiene sentido unir los puntos de esta manera. Sólo tiene sentido si el orden de las observaciones es muy importante. Mi entendimiento es que el hecho de que son anti-correlación no tiene nada que ver con su pedido.

Así que usted debe trazar una contra la otra, para obtener una nube de puntos. Medir la correlación utilizando una métrica como el coeficiente de correlación de Pearson, y que presumiblemente obtener un valor negativo como -0.5 o así.

A continuación, puede mostrar que esto es estadísticamente significativa por la aleatoriedad de la prueba:

usted tiene los siguientes valores:

blue0, blue1, ... , bluen y red0, red1, ... redn

Diciendo que el anti-correlación que se observa es significativo y es poco probable que suceda por casualidad básicamente significa que si en lugar de coincidencia bluek a redk de todo k, coincide con ellos al azar, entonces es muy poco probable que el conjunto de datos resultante mostrará este nivel de correlación.

Así que usted puede comprobar esto mediante la generación de muchas permutaciones al azar de la red de datos, y el cálculo de la correlación de la permutada roja de valores con el original azul.

Ordenar los valores de correlación obtenidos, y ver cómo extrema de la verdadera correlación es. Es en la parte superior del 1%? 0.1%? Esto da una estimación de que tan probable es que suceda por casualidad.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X