Tengo curiosidad por saber si alguien tiene experiencia o puede indicarme algunos recursos sobre la metodología de muestreo para revisar las grabaciones de vídeo de vigilancia. Por ejemplo, digamos que tenemos 6480 horas de vídeo (3 meses por 30 días x 24 horas x 3 cámaras) y nos interesa caracterizar alguna actividad que se produce (no necesariamente enumerar). Digamos que sabemos que los individuos que realizan esta actividad tienden a estar presentes por la noche y es más probable que estén presentes durante el segundo mes que el primero o el tercero. La actividad puede darse varias veces a lo largo del periodo de seguimiento, por lo que no se trata de capturarla una sola vez, ni tampoco nos interesa capturar todos los casos de la actividad. Sólo queremos tomar una muestra suficiente para poder caracterizar a la población que realiza esta actividad. A modo de ejemplo, digamos que la actividad se produce 1.000 veces durante el periodo de seguimiento (siendo más frecuente por la noche y durante la mitad del periodo de seguimiento) y dura entre 10 y 30 minutos por instancia. La actividad puede solaparse, es decir, varios individuos pueden, aunque no necesariamente, estar realizando la actividad al mismo tiempo en la pantalla. ¿Cómo podemos muestrear este material (por ejemplo, seleccionando entre el 10 y el 20 por ciento del material total) para poder maximizar el número de instancias que observamos sin desperdiciar el trabajo de revisar todo el material?
EDIT: Como se ha aludido en algunos de los comentarios, en realidad hay dos cosas en juego. La primera es que quiero muestrear el material de tal manera que maximice la posibilidad de que una persona esté presente en la pantalla. Dado que una persona está presente puede estar realizando alguna actividad, lo que quiero hacer es caracterizar la gama de comportamientos. Para ello quiero ser capaz de ver suficientes individuos como para poder decir que he visto una selección representativa de sus comportamientos. Tengo datos sobre la primera parte del problema. Sin revelar demasiado, déjame darte esos datos reales para que juegues con ellos. Lo que sigue son los recuentos totales de individuos vistos en las grabaciones de una cámara cercana al lugar que me interesa. He resumido estos recuentos primero por hora y segundo por día del año. Por ejemplo, a lo largo de cinco años, se vieron 1005 individuos en la hora 0 (de medianoche a la 1:00 AM) durante los tres meses de seguimiento. Del mismo modo, a lo largo de cinco años, se vieron 29 individuos en el día 182 (a cualquier hora). Mi idea es utilizar estos recuentos para obtener pesos para una muestra aleatoria ponderada. Como nota al margen, si estuviera interesado en estimar el número total de individuos que vería si viera todas las filmaciones me doy cuenta de que puedo utilizar un estimador de Horvitz-Thompson.
tab.24<-data.frame(hour<-seq(0,23, 1),
count<-c(1005, 851, 750, 562, 311, 176, 132, 83, 99, 93, 87, 83,
89, 82, 83, 114, 187, 148, 152, 199, 398, 767, 1002, 1100))
tab.day<-data.frame(doy<-seq(182,273),
count<-c(29, 19, 18, 31, 25, 24, 44, 49, 54, 42, 38, 75, 71, 62, 71, 96,
142, 157, 117, 77, 159, 107, 104, 126, 134, 91, 146, 192, 223, 181, 201,
210, 178, 128, 203, 204, 250, 176, 243, 196, 213, 187, 200, 167, 160, 141,
120, 162, 178, 171, 145, 103, 99, 75, 114, 148, 140, 81, 69, 77, 49, 59, 44,
54, 58, 51, 46, 47, 54, 49, 35, 35, 39, 46, 46, 60, 20, 22, 37, 18, 22, 28,
38, 29, 30, 17, 22, 10, 18, 9, 15,3))