Me gustaría saber cuál es el el más pequeño es el formato de archivo que puedo utilizar con GDAL y que cumple los siguientes criterios:
- sin pérdidas compresión
- (relativamente) fácil de leer/escribir con GDAL Python bindings
- menos espacio HDD utilizado
- rendimiento de lectura/escritura aceptable
¿Qué he probado hasta ahora? El mejor resultado hasta ahora parece ser un GeoTiff en mosaico con compresión LZW:
gdal_translate -co "TILED=YES" -co "COMPRESS=LZW"
¿Por qué busco esto?
Estoy a punto de procesar conjuntos de datos de series temporales que ocuparán unos 6-8 TB en formato binario secuencial de banda. El procesamiento es bastante extenso, pero el resultado sólo pesará unos 30-40 GB. Sé que si utilizo la compresión, el rendimiento de lectura/escritura se verá afectado. Una degradación de la velocidad de entrada/salida de entre el 300% y el 500% es aceptable, pero ocupar un disco duro de 6-8 TB no lo es.
editar:
Después de la respuesta que escribí un pequeño script en python que pone a prueba el rendimiento de diferentes compresiones y una imagen de entrada de su elección y una pequeña descripción -. Comparación de la compresión GeoTiff