5 votos

La correlación de los sellos de tiempo

Digamos que yo soy el análisis de patrones de comportamiento en el transcurso de una hora. He grabado tres diferentes comportamientos y los sellos de tiempo (inicio final) que ocurrieron. Algo así como:

yawning       stretching    whispering
2:21-2:22     3:31-3:33     1:21-1:30
3:42-3:45     8:23-8:59     9:27-9:33
9:20-925      9:34-9:44     14:04-14:07
14:45-14:32   15:01-15:06   18:00-18:22
.
.
.
45:40-45-43   45:23-45:30   44:19-44:44

Hay un método estadístico para determinar si ciertos comportamientos correlacionar o cluster en torno a ciertos períodos de tiempo/el uno al otro? Por ejemplo, tal vez quiero saber si estos tres (o 2) los comportamientos se encuentran muy cerca uno de otro, o tal vez quiero saber si estos comportamientos que no están en estrecha proximidad entre sí. Cual de los tres comportamientos tienden a agruparse juntos?

Yo no sé ni qué campo de las estadísticas de estoy buscando con esto.

2voto

Ted Puntos 854

Estoy suponiendo que las filas en la forma en la que ha presentado los datos no necesariamente significa nada, es decir no es necesario vínculo entre el tercer bostezo, tercer susurro, y el tercer tramo. Lo que te interesa con el tercer bostezo es "¿qué tan cerca está presente en el tiempo a cualquier susurro - no sólo de la tercera susurro".

Para cada bostezo me gustaría calcular el tiempo a la más cercana susurro y el tiempo para el tramo más cercano. Y del mismo modo para cada susurro calcular la hora más cercana al estiramiento y a la hora más cercana al bostezo); y para cada tramo. A continuación, me gustaría calcular algún tipo de indicador de estadísticas de la proximidad de cada comportamiento para cada uno de los otros dos - algo así como el tapizado en la media distancia en el tiempo a la más cercana de la conducta de otro tipo. (Habrá seis de estos indicadores, no sólo tres, porque el promedio de tiempo de un bostezo a su más cercano tramo no es el mismo que el promedio de tiempo de un tramo a su más cercano bostezo.)

Esto ya se va a dar cierta sensación de que los comportamientos están agrupados, pero usted también debe comprobar que esto no es factible debido sólo a la casualidad.

Para comprobar eso, me gustaría crear simulada de los datos generados por un modelo bajo la hipótesis nula de no relación. Haciendo esto requeriría la generación de datos para cada comportamiento del tiempo de un posible modelo nulo, probablemente basados en remuestreo de los tiempos entre cada evento (por ejemplo, entre cada bostezo) para crear un nuevo conjunto de sellos de tiempo para hipotético modelo nulo eventos. A continuación, calcular el mismo indicador de estadística para este modelo nulo y comparar con el indicador de su genuina de datos. Mediante la repetición de esta simulación de un número de veces, usted podría averiguar si el indicador a partir de los datos es lo suficientemente diferente del modelo nulo de datos simulados (menor tiempo promedio de cada bostezo para el tramo más cercano, por ejemplo) a contar como evidencia estadísticamente significativa en contra de su hipótesis nula.

1voto

KitCarrau Puntos 131

He problema similar mi solución fue ingenuo - crear nuevas variables que representan a cada minuto del día, si se le da activite tuvo lugar a continuación, marca que minutos antes de la 1 :

yawning     ->  yawning  
...             ...
2:21-2:22       2:21 1
3:42-3:45       2:22 1
9:20-925        2:23 0
14:45-14:32     . 
.               3:42 1
.               3:43 1
.               .
45:40-45-43     .

ahora tenemos nueva serie de tiempo, que podemos analizar por métodos más convencionales, esto funcionó muy bien, he probado en en la simulación de datos de abajo del modelo logit, donde x es la variable 0-1, z - "conducción" de la variable : p(x(t+1)=1|p(x)=1)=exp(x+B1*z)/denominator la misma y, más cerca estaba de B2 a B1 el mejor de la dependencia entre x e y se mide por la distancia de Hamming.

Problema metodológico : ¿qué hacer si el tiempo total de la activity_11 durante el día es 10 veces más alta que la de activity_2 ? A veces no importa, a veces, algunas distancia ponderada es necesario - en el caso de que cuando queremos crear la matriz de distancias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X