Estoy trabajando en el problema de la migración de datos de votación de un grupo, divisiones electorales, a otro, divisiones de censo. No estoy seguro de si este es un problema común en las estadísticas en general, pero en el mundo espacial a menudo se le llama el "problema de la unidad de área modificable", y estoy luchando para encontrar una manera de cuantificar el error.
Por ejemplo, imaginemos que tenemos un sistema bipartidista en el que la gente puede votar por el Partido A, el Partido B, o no votar en absoluto. En un pequeño barrio, una calle se divide de manera que hay 10 casas, divididas entre dos grupos de la siguiente manera, donde las líneas representan la agrupación de casas (las H) en divisiones electorales:
EDiv 1 EDiv 2
________________________ __________________________
H1 H2 H3 H4 H5 H6 H7 H8 H9 H10
Sabemos que exactamente una persona vive en cada casa. También sabemos que en EDiv 1, había 2 votos del Partido A, 1 del Partido B y 2 no votantes. En EDiv 2, había 1 votante del Partido A, 3 votantes del Partido B, y 1 no votante.
Estamos interesados, sin embargo, en averiguar la distribución de los votos por división de censo. Estas, sobre las mismas casas de arriba, se ven así:
CDiv 1 CDiv 2 CDiv 3
____________ ______________________ ____________
H1 H2 H3 H4 H5 H6 H7 H8 H9 H10
La pregunta es entonces en dos partes: 1) cómo estimar el total de votos en las divisiones del censo, y 2) cómo cuantificar la incertidumbre.
Mi enfoque de la primera parte (que puede ser incorrecto) fue realizar los cálculos parte por parte. Por ejemplo:
Para el Partido A en EDiv 1, cada casa tiene una probabilidad de votar por ellos de 2/5 = 0.4. En EDiv 2 es 1/5 = 0,2. Entonces, cuando los agrupas por divisiones del censo, sumas las probabilidades, así que CDiv 2 tendría probablemente 0,4 + 0,4 + 0,2 + 0,2 = 1,2 votos para el Partido A.
¿Es este el enfoque correcto, y si es así, cómo cuantifico el error? También vale la pena mencionar que los datos reales con los que estoy trabajando son a una escala muy pequeña (típicamente ~500 personas por área), lo que ayuda a reducir el problema del MAUP en comparación con las grandes divisiones espaciales.
2 votos
Quizá quieras echar un vistazo (o citar) a Gotway, Carol A., y Linda J. Young. "Combinación de datos espaciales incompatibles". Journal of the American Statistical Association 97.458 (2002): 632-648.
0 votos
@JonathanLisic Gracias por la referencia, acabo de leer las partes pertinentes. La parte más cercana parece ser la sección 5.5, donde se habla de utilizar una covariable para transformar los datos entre los dos "soportes espaciales". En este caso, estoy usando hogares para hacer eso. No soy un estadístico, así que estoy haciendo mi mejor esfuerzo para analizar lo que se recomienda, pero parecía que en lugar de asignar valores individuales a cada hogar, debería representar su probabilidad utilizando una distribución de Poisson. ¿Estoy en el camino correcto? Voy a buscar algunos de los documentos más recientes sobre esto ahora.
2 votos
En realidad, puede obtener límites en sus números asignados, ver stats.stackexchange.com/a/15803/1036 .
0 votos
@AndyW ¡Gracias! Parece que esto se aplicaría al caso en el que estás dividiendo una sola área en múltiples áreas más pequeñas, pero podría no aplicarse cuando se mueve entre áreas de tamaño similar que no necesariamente se superponen.
1 votos
Si la terminología le ayuda a buscar, el caso en el que se desplazan las divisiones espaciales sin cambiar el tamaño se denomina variante de "zonificación" del MAUP. Pero, ¿tienes alguna referencia que sugiera que la MAUP se aplica a probabilidades como éstas? Pensaba que sólo era un problema para la correlación.
0 votos
@JKelly Basándome en el documento que cité en la respuesta de abajo, parece que muchas de las técnicas MAUP desarrolladas en los años 90 y 00 eran para cuando sólo se disponía de ciertos conjuntos de datos, como landsat, y no de cosas como puntos de dirección o recuentos de unidades residenciales. Este parece ser un problema de MAUP en el sentido de que se trata de migrar datos agregados de una unidad espacial a otra, pero difiere de muchos de los casos en los que se aplican tradicionalmente las técnicas de MAUP.