4 votos

¿Cómo analizar varios tipos de datos geo juntos?

Tengo algunos datos recogidos de una encuesta realizada dentro de mi ciudad. Todas las respuestas incluyen un aproximado de ubicación geográfica de donde estaban reunidos (exacto probablemente un par de cientos de metros, que es relativamente pequeño), y cosas como los encuestados edad, sexo, nivel de ingresos, número de dependientes, etc. Hay aprox. 4000 respuestas.

Lo que me gustaría es ser capaz de generar lo que supongo que se podría llamar un modelo, por lo que, dado un geo punto (o caja) yo podría caracterizar el típico demandado desde allí (que en realidad no tiene que ser muy riguroso, aunque algunos formal de la confianza de la medición sería bueno).

Así que, es lo que hay que hacer para, simplemente, tratar a todos los reunidos atributos por separado y decir "Bueno, la edad de su típico demandado en esa zona es m con stdev s, y su rango de ingresos es ..., etc".

O hay alguna mejor forma de analizar los datos para obtener un mejor perfil de los encuestados.

Algunas frases clave para google podría incluso ayudar en esta etapa, porque estoy un poco perdido. Pensé que esto podría ser "fusión de datos" pero creo que no lo es.

5voto

rutherford Puntos 165

¿Qué acerca de un estimador que es un promedio por encima de su más cercano k vecinos con las ponderaciones dadas a los vecinos disminuyendo con la distancia al punto de destino.

El derecho de la conicidad de los pesos podrían estar en forma antes de utilizar algún tipo de error en la minimización del plan de formación?

Alternativamente, yo estaba pensando en una de Voronoi tessalation. Para un punto de interés de encontrar su celda de Voronoi y añadir el efecto de vecino de células con un peso reducido y así sucesivamente?

Demasiado simplista?

PS. Habría una posibilidad de que los Ingresos (por ejemplo) en un lugar mejor de lo predicho por $fn(income, age, sex)$ de sus vecinos que por el mero hecho de $fn(income)$ de sus vecinos?

En esencia, se puede mezclar predictores de obtener un mejor modelo predictivo de mantenerlos separados?

En el extremo podría tener alguna vez una situación en la vecina edad solo fue un mejor predictor de los puntos de ingreso de vecino de la renta? Sólo me preguntaba.

4voto

Judioo Puntos 625

La respuesta corta es que los "normales" que se forma en las ciencias sociales es tener pre-definido de áreas discretas y proporcionar las estadísticas de resumen para las muestras dentro de esas áreas se agregan. Ejemplos de áreas predefinidas se pueden geografía del censo, zip-códigos, o cualquier otro barrio de la unidad que se puede soñar.

Esta es la costumbre, porque es bastante raro que las encuestas geocodificada a la ubicación exacta o ser capaz de utilizar esa información debido a razones de privacidad, por lo general, las encuestas no pueden ser geolocalizadas además dentro de un área general de todos modos. Incluso si usted no tiene pre-definidas las áreas que siempre se puede crear una red uniformes (es decir, quadrats) y proporcionar las estadísticas de resumen. Si el muestreo sobre la ciudad se aparta de uniforme a pesar de que este enfoque no funcionará tan bien, ya que podría tener algunos quadrats con par (o cero) de las muestras y algunos con muchas de las muestras (de hecho algunas personas justifican la agregación de unidades más grandes, porque de tales preocupaciones).

Más de la novela es utilizar lo que van Ham & Manley (2012) se refieren a el como a la medida de los barrios. Esencialmente uno elige un punto y, a continuación, algunos arbitraria de amortiguamiento alrededor de ese punto y, a continuación, las estimaciones de cualquier estadística de resumen uno está interesado en la base de muestras alrededor de ese punto. Ejemplos relacionados se pueden encontrar en Lee et al. (2008), Li & Radke (2012) y Ratcliffe & Taniguchi (2008).

Si desea más mediciones continuas durante todo el espacio de estudio, usted puede utilizar la geo-estadística de kriging para la estimación de una superficie continua (aunque esto también es bastante novedoso para las ciencias sociales). Ejemplos similares se pueden encontrar en la literatura de las ciencias sociales bajo el área a punto de kriging (que es un contexto ligeramente distinto). Ver esta otra respuesta de la mina para obtener una lista de los expertos con ejemplos.


Citas

  • Lee, B. A., Reardon, S. F., Firebaugh, G., Farrell, C. R., Matthews, S. A., y O'Sullivan, D. (2008). Más allá del censo: Patrones y determinantes de la segregación racial en múltiples escalas geográficas. American Sociological Review, 73(5):766-791. PDF Aquí.
  • Li, W. y Radke, J. D. (2012). Geoespacial de la integración de datos y modelos para la investigación de barrio urbano de la delincuencia. Anales de SIG, 18(3):185-205.
  • Ratcliffe, J. H. y Taniguchi, T. A. (2008). Es delito de alta alrededor de las drogas pandilla esquinas de las calles?: Dos espacial enfoques de la relación entre las pandillas conjunto de los espacios y de los niveles de delincuencia local. Patrones de delincuencia y de Análisis, 1(1):23-46. PDF en el enlace
  • van Ham, M. y Manley, D. (2012). Barrio de la investigación de los efectos en una encrucijada: Diez desafíos para la investigación futura. Medio ambiente y la Planificación de Una, 44(12):2787-2793.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X