He encontrado un par de otras preguntas de Stack Exchange relacionadas con esto, pero no fueron satisfactorias.
Por ejemplo:
¿Cómo calcula ArcGIS Desktop el punto INSIDE para el Feature to Point?
no me dice cómo se determina el punto "Interior". Mientras que el ArcObjects puede referirse a centroides y puntos de la etiqueta, tengo al menos 4 resultados en mi situación que varían de manera diferente, salvajemente en algunos casos.
Tengo puntos no identificables dentro de códigos postales, así que asigno cada uno al centroide de ese código postal. A continuación, calcularé las distancias en línea recta desde estos centroides a varios lugares de interés. Por lo tanto, mi elección del centroide es importante. Algunos códigos postales también tienen formas Impares y posiblemente sean discontinuos. Al menos eso es lo que supongo que genera algunos de los comportamientos impar.
Ahora, he encontrado cuatro formas diferentes de identificar la posible centralidad de estos polígonos.
- La geometría del polígono contiene una información del centroide que puede ser extraída directamente (¿y supuestamente se utiliza para el etiquetado?).
- La ubicación de la etiqueta del polígono (que he descubierto que no siempre coincide con la ubicación del punto anterior, de ahí la confusión).
- Método de conversión de rasgos en puntos con la opción "centroide".
- Método "feature to point" con la opción "inside".
Algunas de ellas o la mayoría pueden coincidir. En algunos códigos postales, todos son completamente diferentes. Habría esperado que 1. y 3. fueran similares y tal vez incluso 1. y 2. fueran idénticos, dependiendo de cómo se configure el etiquetado (estoy usando el predeterminado).
Mi pregunta no es "¿cómo se calculan?" Eso no es ni aquí ni allá, ya que sus algoritmos están patentados, y no tiene sentido tratar de averiguarlo.
La verdadera cuestión es práctica, es decir ¿cómo se debe determinar el centroide adecuado que hay que utilizar?
Mi conclusión es que el método feature to point con la opción "inside" será el más apropiado porque se garantiza que reside dentro del límite del polígono. También asumo que será relativamente central. Pero las descripciones sobre esto son nebulosas, por ejemplo, considere un polígono con forma de media luna. El centroide estaría fuera de la media luna pero en el centro de la envoltura que lo encapsula. ¿Una opción "interior" lo "empujaría" literalmente hacia la media luna? Puede que no conozcamos el algoritmo, pero ¿la opción "dentro" identifica realmente la centralidad? ¿Es mejor que 1.? ¿Quizá me estoy perdiendo algo en el planteamiento de este problema? ¿Puede la proyección influir en estas comparaciones? ¿Hay alguna revisión posterior al procesamiento de los polígonos que deba considerar?
2 votos
Es una gran pregunta, pero gran parte de su interés proviene de su afirmación de que la elección de un punto central en cada polígono ZIP será importante para sus análisis posteriores. Si es así, debería considerar no sustituir los polígonos por puntos. Lo que debería hacer en su lugar depende del significado de las distancias que vaya a calcular, de lo que vaya a hacer con esas distancias y de sus limitaciones informáticas en relación con el tamaño del conjunto de datos. Por lo tanto, le rogamos que nos oriente explicando estas cosas.
0 votos
Bueno, el problema es que no tenemos ubicaciones individuales, sólo sus códigos postales. Por lo tanto, tiene sentido representar su ubicación mediante el código postal. Sin embargo, para dar una estimación bruta de su distancia a otra ubicación (hospitales, en este caso), un punto a punto parece lo más apropiado, puesto que ya los estamos generalizando al código postal. Si tuviéramos redes, sería mejor, pero vamos a hacer la distancia a vuelo de pájaro. ¿Tiene sentido? No veo una forma mejor. Creo que la centralidad de los polígonos (¿centro de masa?) sería mejor (que, por ejemplo, el centro de la geometría?)
2 votos
Ignorando los códigos postales que no representan áreas o lugares definidos, podemos pensar que representan regiones poligonales. Si sabemos que un lugar se encuentra dentro de un polígono de este tipo, si queremos estimar su distancia a un hospital (por ejemplo), podríamos media sobre todas las distancias entre el polígono y ese lugar. Desgraciadamente, ningún punto puede sustituir a esa media, porque depende de la ubicación del hospital. Sin embargo, si se toma la raíz cuadrada de la distancia media al cuadrado, se obtiene una buena solución: utilizar la función centroide (¡incluso si está fuera del polígono!)
0 votos
Sabes, ¡esa puede ser una respuesta legítima! lol Ni siquiera había concebido el problema de esa manera. ¿Estás diciendo que el centroide, aunque esté fuera del centro, es la mejor comparación punto a punto porque su distancia será una mejor representación para el polígono pero sería más preciso tomar la raíz cuadrada media (RMS) de todos los puntos del polígono a una ubicación? ¿Tiene algún libro de referencia para esta metodología en el SIG? ¡Puede ser prudente citar algo en la investigación! Sin embargo, tiene sentido. ¡Muchas gracias! Nota al margen, ¿tiene ArcGIS métodos (herramientas) para esto?
0 votos
Como curiosidad, resulta interesante la exploración para comparar la distancia del centroide a un lugar determinado y cómo calcularíamos la RMS para todos los puntos de un polígono. Computacionalmente, eso no parece factible, pero puedo imaginar un proceso (en R) que genere aleatoriamente una muestra de (¡muchos!) puntos en el polígono y luego tome el RMS para esos. Mientras el número de N puntos sea lo suficientemente grande, esto debería ser una buena aproximación, ¿no? Me pregunto si sería una mejor estimación que la distancia punto a punto del centroide.
1 votos
El centroide es especial, Bryan, en el sentido de que no tenemos que hacer todo ese esfuerzo computacional: es único entre todos los puntos relacionados con un polígono en el sentido de que la distancia media al cuadrado entre el polígono y cualquier otro punto es igual a una constante (que depende sólo de la forma del polígono) más la distancia al cuadrado entre el centroide y ese otro punto. Esa constante viene dada por el momento de inercia total (segundo) del polígono, que se calcula tan fácilmente como el propio centroide. No digo que este sea el método adecuado para tu aplicación, pero sí que es sencillo. ¿Qué vas a hacer con estas distancias?
0 votos
Vamos a hacer un modelo de regresión logística multinomial que, en su forma más básica, utilizará las distancias para estimar las probabilidades de que alguien elija, en este caso, un tipo de hospital. Por lo tanto, estamos buscando la distancia al hospital más cercano, al hospital más cercano de un determinado tipo, y la distancia al hospital que eligieron. Aunque sería estupendo disponer de una medida de distancia más realista (individuo real a la ubicación y tiempo/costes de viaje reales de la red), vamos a tener que agregar al código postal la elección del hospital, esencialmente.
1 votos
Hace un año hice un análisis similar, también con un modelo logístico multinomial de elección del consumidor. Un código postal cubre un área lo suficientemente grande como para marcar una diferencia real en la elección del hospital, por lo que se va a perder alguna información potencialmente importante al agregar sobre un código postal. (Utilicé los tiempos de viaje en varias formas de transporte basadas en direcciones geocodificadas). También puede ser importante utilizar las distancias a muchos hospitales competidores, no sólo la distancia al más cercano. Véase Lee & Cohen, "A Multinomial Logit Model for the Spatial Distribution of Hospital Utilization" (JBES 1985).
0 votos
Muchas gracias por ello. Si quieres, puedes compilar todo esto en una respuesta completa y contaré esto como resuelto, ya que creo que esta discusión ha revelado más que suficiente lo que se requiere al pensar en el uso del centroide (las referencias adicionales siempre son bienvenidas). O, como StackExchange está indicando, ¿tal vez debería migrar esto al Chat?
0 votos
¿No podría utilizar la herramienta Generar tabla de proximidad de la caja de herramientas de ArcGIS? Esta herramienta determina las distancias de cada característica en las características de entrada a una o más características cercanas en las características cercanas, dentro del radio de búsqueda. Los resultados se registran en la tabla de salida.
0 votos
La discusión en los comentarios aquí, y la única respuesta hasta ahora, parece no involucrar productos particulares, por lo que voy a eliminar los nombres de los productos de su pregunta y etiquetarla en su lugar como principio gis . Como alternativa a que @whuber escriba una respuesta, puede considerar parafrasear la discusión para crear una auto-respuesta, lo cual es perfectamente permisible,