Tengo algunos datos recogidos de una encuesta realizada dentro de mi ciudad. Todas las respuestas incluyen un aproximado de ubicación geográfica de donde estaban reunidos (exacto probablemente un par de cientos de metros, que es relativamente pequeño), y cosas como los encuestados edad, sexo, nivel de ingresos, número de dependientes, etc. Hay aprox. 4000 respuestas.
Lo que me gustaría es ser capaz de generar lo que supongo que se podría llamar un modelo, por lo que, dado un geo punto (o caja) yo podría caracterizar el típico demandado desde allí (que en realidad no tiene que ser muy riguroso, aunque algunos formal de la confianza de la medición sería bueno).
Así que, es lo que hay que hacer para, simplemente, tratar a todos los reunidos atributos por separado y decir "Bueno, la edad de su típico demandado en esa zona es m con stdev s, y su rango de ingresos es ..., etc".
O hay alguna mejor forma de analizar los datos para obtener un mejor perfil de los encuestados.
Algunas frases clave para google podría incluso ayudar en esta etapa, porque estoy un poco perdido. Pensé que esto podría ser "fusión de datos" pero creo que no lo es.