Tengo un antiguo conjunto de datos vectoriales con polígonos que cubren un continente. Los datos se publicaron por primera vez en papel a escala 1:5 000 000 y posteriormente se digitalizaron. No tengo los datos originales ni información sobre la vectorización ni ningún metadato. Supongo que la distancia entre los vértices, más que la precisión, limita la resolución.
Los vértices se guardan con alta resolución (por ejemplo, "nnn.nnnnnnn","-nn.nnnnnnn"). El conjunto de datos tiene pocos puntos que puedan ser georreferenciados ni nodos que estén definidos como coordenadas (por ejemplo, en grados pares o coordenadas UTM). Cuando comparo algunos tramos de costa, el error es de hasta +/- 20 km.
Me gustaría encontrar una fórmula para estimar el error máximo en función de la distribución de los vértices. Tengo acceso a cualquier Aplicación del SIG, pero preferiría una referencia estadística sólida.
¿Cómo puedo calcular el error máximo del conjunto de datos, suponiendo que todos los vértices son correctos? O dicho de otro modo: ¿Qué método puedo utilizar para encontrar la mayor resolución del conjunto de datos?
Intenté rasterizar el conjunto de datos con diferentes tamaños de celda y luego sobremuestrearlo a un tamaño de celda pequeño para detectar la rasterización más pequeña posible sin pérdida de resolución, pero ese es un enfoque que consume bastante tiempo y no es muy matemático.