Así, GDAL ha añadido recientemente un nueva función que permite la lectura aleatoria de archivos de cubo S3. Estoy buscando para recortar imágenes GDAL de múltiples azulejos de una imagen sin tener que descargar todo el archivo. Sólo he visto documentación muy escasa sobre cómo configurar y acceder a un cubo de S3 a través de GDAL y estoy un poco confundido sobre cómo empezar? ¿Sería alguien tan amable de proporcionar un ejemplo/tutorial extremadamente corto sobre cómo uno iría sobre la configuración del sistema de archivos virtual para GDAL con el fin de lograr este objetivo? ¡Pts de bonificación si su solución permite que sea de secuencias de comandos a través de Python!
Para aclarar: ya lo tenemos hecho en Python. El problema con Python es que hay que descargar toda la imagen para poder operar con ella. La versión más reciente de GDAL tiene soporte para montar el cubo S3 de modo que si necesitamos, por ejemplo, recortar una pequeña porción de la imagen, podemos operar directamente sobre esa pequeña porción. Por desgracia, como la característica sólo se publicó en la rama estable en enero, no he encontrado ninguna documentación al respecto. Así que la solución debe utilizar el sistema VSI3 en la versión más reciente de GDAL o de otra manera inteligente utiliza el sistema para evitar que el usuario tenga que descargar toda la imagen a una unidad de EBS para operar en él.
Es decir, la recompensa se otorgará a la respuesta que utilice las API de VSI que se encuentran en las versiones más recientes de GDAL para que no sea necesario leer todo el archivo en memoria o en disco. Además, los buckets que utilizamos no siempre son públicos, por lo que muchos de los trucos HTTP que se publican no funcionarán en muchas de nuestras situaciones.