La consulta de PostGIS solía ejecutarse muy rápidamente en Postgres 9.6 / PostGIS 2.4, ahora es extremadamente lenta en Postgres 12.4 / PostGIS 3.0

Tenemos dos servidores virtuales en el mismo hardware (especificaciones idénticas, 6 núcleos Intel Xeon E5-2643), uno está ejecutando Postgres 9.6 con PostGIS 2.4, y el otro está ejecutando Postgres 12.4 con PostGIS 3.0. Ambos utilizan GEOS.

Estamos utilizando una función personalizada de PostGIS que se puede encontrar aquí: https://github.com/iboates/ST_RayCast

Utilizando un conjunto de datos sencillo, podemos calcular el resultado instantáneamente en el servidor 9.6/2.4, pero tarda 8 segundos o más en el servidor 12.4/3.0.

Puedes probarlo con estos datos:


CREATE TABLE public.canyon_points (
    id integer NOT NULL,
    geom public.geometry(Point,23947)

INSERT INTO public.canyon_points (id, geom) VALUES (1, '01010000208B5D00007AE68ED83ED111412DDA68187C884141');
INSERT INTO public.canyon_points (id, geom) VALUES (2, '01010000208B5D0000D7D006A6E5D1114171D906BB81884141');
INSERT INTO public.canyon_points (id, geom) VALUES (3, '01010000208B5D0000371DD89F68D211419981959D85884141');
INSERT INTO public.canyon_points (id, geom) VALUES (4, '01010000208B5D00002CC0B22166D21141C656944C96884141');
INSERT INTO public.canyon_points (id, geom) VALUES (5, '01010000208B5D0000C2C09A9F61D2114109D4646EAB884141');
INSERT INTO public.canyon_points (id, geom) VALUES (6, '01010000208B5D0000E1BFBE6268D21141DB50C7F1C3884141');
INSERT INTO public.canyon_points (id, geom) VALUES (7, '01010000208B5D00002CC0B22166D21141A34D4BBDDC884141');
INSERT INTO public.canyon_points (id, geom) VALUES (8, '01010000208B5D00000DC18E5E5FD21141594A1219F6884141');
INSERT INTO public.canyon_points (id, geom) VALUES (9, '01010000208B5D0000EDC16A9B58D2114151C7EE7B0D894141');
INSERT INTO public.canyon_points (id, geom) VALUES (10, '01010000208B5D0000D1B63243AED2114195C68C1E13894141');
INSERT INTO public.canyon_points (id, geom) VALUES (11, '01010000208B5D0000E3A0B65157D31141D746A22511894141');

ALTER TABLE ONLY public.canyon_points
    ADD CONSTRAINT canyon_points_pkey PRIMARY KEY (id);


CREATE TABLE public.canyon_building (
    id integer NOT NULL,
    geom public.geometry(Polygon,23947),
    height double precision

INSERT INTO public.canyon_building (id, geom, height) VALUES (1, '01030000208B5D0000010000000500000093B51104F2D01141088E0BF70A894141FB185D700AD21141695CE44F0B89414111FFE9FD0FD21141E3F796FEE9884141A99B9E91F7D011416931FA61EB88414193B51104F2D01141088E0BF70A894141', 7);
INSERT INTO public.canyon_building (id, geom, height) VALUES (2, '01030000208B5D00000100000005000000A99B9E91F7D011416931FA61EB884141A99B9E91F7D01141B1DC2489CD884141FB185D700AD21141CAD4E8CCCB88414111FFE9FD0FD21141E3F796FEE9884141A99B9E91F7D011416931FA61EB884141', 6);
INSERT INTO public.canyon_building (id, geom, height) VALUES (3, '01030000208B5D00000100000005000000A99B9E91F7D01141B1DC2489CD88414193B51104F2D0114136EB9DFEAE88414175B40F1FE9D11141ED1489E9AC884141FB185D700AD21141CAD4E8CCCB884141A99B9E91F7D01141B1DC2489CD884141', 8);
INSERT INTO public.canyon_building (id, geom, height) VALUES (4, '01030000208B5D000001000000050000007CCF8476ECD011411FDA26838988414193B51104F2D0114136EB9DFEAE88414175B40F1FE9D11141ED1489E9AC884141535BBCCAE0D11141115529068E8841417CCF8476ECD011411FDA268389884141', 8);
INSERT INTO public.canyon_building (id, geom, height) VALUES (5, '01030000208B5D00000100000005000000DCC186AFC1D21141CB2ABDA80B894141709B175BA5D3114145F159450A8941418681A4E8AAD311418A8A4DB6F3884141098EA0CACCD21141D36062CBF5884141DCC186AFC1D21141CB2ABDA80B894141', 4);
INSERT INTO public.canyon_building (id, geom, height) VALUES (6, '01030000208B5D00000100000005000000098EA0CACCD21141D36062CBF5884141E7344D76C4D21141A01A0668B9884141385C377997D3114101E9DEC0B98841418681A4E8AAD311418A8A4DB6F3884141098EA0CACCD21141D36062CBF5884141', 5);
INSERT INTO public.canyon_building (id, geom, height) VALUES (7, '01030000208B5D00000100000005000000E7344D76C4D21141A01A0668B9884141F2A7133DC7D21141E8C5308F9B884141DFC3034381D3114101BEF4D299884141385C377997D3114101E9DEC0B9884141E7344D76C4D21141A01A0668B9884141', 8);

ALTER TABLE ONLY public.canyon_building
    ADD CONSTRAINT canyon_building_pkey PRIMARY KEY (id);

Función ST_RayCast

    in_point GEOMETRY,
    in_boundaries GEOMETRY,
    out_geom_type TEXT,
    num_rays INTEGER,
    max_ray_dist FLOAT


    adj FLOAT;
    opp FLOAT;
    theta FLOAT = 0;
    srid INTEGER = ST_SRID(in_point);
    candidate_geom GEOMETRY;
    return_geom GEOMETRY;


    /* Do preliminary checks for common problems */
    IF ST_SRID(in_boundaries) != srid THEN
        RAISE EXCEPTION 'SRID of input points (%) does not match input boundaries SRID (%)', ST_SRID(in_point), ST_SRID(in_boundaries);
    END IF;

        RAISE EXCEPTION 'Output geometry type (''%'') must be one of (''%'', ''%'')', out_geom_type, 'MULTIPOINT', 'MULTILINESTRING';
    END IF;

    /* Cast rays over the specified angle window */
    WHILE theta < 2*pi() LOOP

        candidate_geom = (
            /* Make a CTE for the casted ray endpoint so we only have to query it once */
            AS MATERIALIZED (
                    /* Make a ray */
                                /* PostGIS only allows projecting points in geographical CRS, so we have to do some transforming here */
                    ) AS geom
                /* Intersect this ray with the input boundaries, ignore empty results (no ray intersection) */
                ) AS geom
                NOT ST_IsEmpty(

        /* In the case of multiple ray intersections, take the closest one */
        IF ST_NumGeometries(candidate_geom) > 1 THEN
            candidate_geom = (
                    ST_DumpPoints(candidate_geom) AS dp
                ORDER BY
                    ) ASC
                LIMIT 1
        END IF;

        /* Either prep the point for return or make a line out of it for return depending on user input */
        IF out_geom_type = 'MULTIPOINT' THEN
            return_geom = ST_Collect(ST_CollectionExtract(return_geom, 1), candidate_geom);
        ELSIF out_geom_type = 'MULTILINESTRING' THEN
            return_geom = ST_Collect(
                ST_MakeLine(in_point, candidate_geom)
        END IF;

        theta = theta + 2*pi() / num_rays;


    /* Return all the points or lines created */
    IF out_geom_type = 'MULTIPOINT' THEN
        RETURN ST_Multi(ST_CollectionExtract(return_geom, 1));
    ELSIF out_geom_type = 'MULTILINESTRING' THEN
        RETURN ST_Multi(ST_CollectionExtract(return_geom, 2));
    END IF;

LANGUAGE plpgsql;
) IS 'Created by Isaac Boates. Use of this software is at the user''s own risk, and no responsibility is claimed by the creator in the event of damages, whether tangible or financial caused directly or indirectly by the use of this software.';


with buildings as (
    select height, geom as geom from canyon_building

street_points as (
        s.id as id,
        s.geom as geom
        canyon_points as s

        ST_CollectionExtract(ST_Collect(ST_ExteriorRing(b.geom)), 2),
        out_geom_type := 'MULTIPOINT',
        num_rays := 16,
        max_ray_dist := 50
    ) as geom
    street_points as sp,
    buildings as b
    ST_DWithin(sp.geom, b.geom, 50)
group by

Como he dicho, en Postgres 9.6 / PostGIS 2.4, se ejecuta casi instantáneamente. En Postgres 12.4 / PostGIS 3.0, tarda 8 segundos o más.

De hecho, soy el autor de esta función Raycast y pude ejecutarla en mi ordenador de casa con unas especificaciones mucho más bajas (por aquel entonces en 9.6), y también era rápida.

He comprobado que no hay ningún proceso VACCUM o de otro tipo, y el uso de la CPU se mantiene cerca de 0 (hasta que ejecutamos la consulta)

¿Alguien tiene idea de lo que está pasando?

Si ayuda, aquí está el resultado de EXPLAIN ANALYZE (puede visualizarse en https://tatiyants.com/pev ):


    "Plan": {
      "Node Type": "Aggregate",
      "Strategy": "Sorted",
      "Partial Mode": "Simple",
      "Parallel Aware": false,
      "Startup Cost": 28419.14,
      "Total Cost": 28891.15,
      "Plan Rows": 200,
      "Plan Width": 64,
      "Actual Startup Time": 404.149,
      "Actual Total Time": 4241.192,
      "Actual Rows": 11,
      "Actual Loops": 1,
      "Group Key": ["s.geom"],
      "Plans": [
          "Node Type": "Sort",
          "Parent Relationship": "Outer",
          "Parallel Aware": false,
          "Startup Cost": 28419.14,
          "Total Cost": 28422.73,
          "Plan Rows": 1435,
          "Plan Width": 64,
          "Actual Startup Time": 0.391,
          "Actual Total Time": 0.426,
          "Actual Rows": 77,
          "Actual Loops": 1,
          "Sort Key": ["s.geom"],
          "Sort Method": "quicksort",
          "Sort Space Used": 45,
          "Sort Space Type": "Memory",
          "Plans": [
              "Node Type": "Nested Loop",
              "Parent Relationship": "Outer",
              "Parallel Aware": false,
              "Join Type": "Inner",
              "Startup Cost": 25.88,
              "Total Cost": 28343.90,
              "Plan Rows": 1435,
              "Plan Width": 64,
              "Actual Startup Time": 0.220,
              "Actual Total Time": 0.297,
              "Actual Rows": 77,
              "Actual Loops": 1,
              "Inner Unique": false,
              "Plans": [
                  "Node Type": "Nested Loop",
                  "Parent Relationship": "Outer",
                  "Parallel Aware": false,
                  "Join Type": "Inner",
                  "Startup Cost": 25.88,
                  "Total Cost": 28308.50,
                  "Plan Rows": 1,
                  "Plan Width": 32,
                  "Actual Startup Time": 0.205,
                  "Actual Total Time": 0.233,
                  "Actual Rows": 7,
                  "Actual Loops": 1,
                  "Inner Unique": false,
                  "Join Filter": "st_dwithin((st_union(s_1.geom)), canyon_building.geom, '50'::double precision)",
                  "Rows Removed by Join Filter": 0,
                  "Plans": [
                      "Node Type": "Aggregate",
                      "Strategy": "Plain",
                      "Partial Mode": "Simple",
                      "Parent Relationship": "Outer",
                      "Parallel Aware": false,
                      "Startup Cost": 25.88,
                      "Total Cost": 25.89,
                      "Plan Rows": 1,
                      "Plan Width": 32,
                      "Actual Startup Time": 0.185,
                      "Actual Total Time": 0.186,
                      "Actual Rows": 1,
                      "Actual Loops": 1,
                      "Plans": [
                          "Node Type": "Seq Scan",
                          "Parent Relationship": "Outer",
                          "Parallel Aware": false,
                          "Relation Name": "canyon_points",
                          "Alias": "s_1",
                          "Startup Cost": 0.00,
                          "Total Cost": 22.70,
                          "Plan Rows": 1270,
                          "Plan Width": 32,
                          "Actual Startup Time": 0.009,
                          "Actual Total Time": 0.012,
                          "Actual Rows": 11,
                          "Actual Loops": 1
                      "Node Type": "Seq Scan",
                      "Parent Relationship": "Inner",
                      "Parallel Aware": false,
                      "Relation Name": "canyon_building",
                      "Alias": "canyon_building",
                      "Startup Cost": 0.00,
                      "Total Cost": 21.30,
                      "Plan Rows": 1130,
                      "Plan Width": 32,
                      "Actual Startup Time": 0.006,
                      "Actual Total Time": 0.007,
                      "Actual Rows": 7,
                      "Actual Loops": 1
                  "Node Type": "Seq Scan",
                  "Parent Relationship": "Inner",
                  "Parallel Aware": false,
                  "Relation Name": "canyon_points",
                  "Alias": "s",
                  "Startup Cost": 0.00,
                  "Total Cost": 22.70,
                  "Plan Rows": 1270,
                  "Plan Width": 32,
                  "Actual Startup Time": 0.003,
                  "Actual Total Time": 0.005,
                  "Actual Rows": 11,
                  "Actual Loops": 7
    "Planning Time": 0.261,
    "Triggers": [
    "Execution Time": 4241.271


    "Plan": {
      "Node Type": "Aggregate",
      "Strategy": "Sorted",
      "Partial Mode": "Simple",
      "Parallel Aware": false,
      "Startup Cost": 435.72,
      "Total Cost": 435.99,
      "Plan Rows": 1,
      "Plan Width": 64,
      "Actual Startup Time": 7.349,
      "Actual Total Time": 57.570,
      "Actual Rows": 11,
      "Actual Loops": 1,
      "Group Key": ["sp.geom"],
      "Plans": [
          "Node Type": "Seq Scan",
          "Parent Relationship": "InitPlan",
          "Subplan Name": "CTE buildings",
          "Parallel Aware": false,
          "Relation Name": "canyon_building",
          "Alias": "canyon_building",
          "Startup Cost": 0.00,
          "Total Cost": 21.30,
          "Plan Rows": 1130,
          "Plan Width": 40,
          "Actual Startup Time": 0.006,
          "Actual Total Time": 0.009,
          "Actual Rows": 7,
          "Actual Loops": 1
          "Node Type": "Seq Scan",
          "Parent Relationship": "InitPlan",
          "Subplan Name": "CTE street_points",
          "Parallel Aware": false,
          "Relation Name": "canyon_points",
          "Alias": "s",
          "Startup Cost": 0.00,
          "Total Cost": 22.70,
          "Plan Rows": 1270,
          "Plan Width": 36,
          "Actual Startup Time": 0.002,
          "Actual Total Time": 0.004,
          "Actual Rows": 11,
          "Actual Loops": 1
          "Node Type": "Aggregate",
          "Strategy": "Plain",
          "Partial Mode": "Simple",
          "Parent Relationship": "InitPlan",
          "Subplan Name": "CTE street_points_union",
          "Parallel Aware": false,
          "Startup Cost": 25.88,
          "Total Cost": 25.89,
          "Plan Rows": 1,
          "Plan Width": 32,
          "Actual Startup Time": 0.216,
          "Actual Total Time": 0.217,
          "Actual Rows": 1,
          "Actual Loops": 1,
          "Plans": [
              "Node Type": "Seq Scan",
              "Parent Relationship": "Outer",
              "Parallel Aware": false,
              "Relation Name": "canyon_points",
              "Alias": "s_1",
              "Startup Cost": 0.00,
              "Total Cost": 22.70,
              "Plan Rows": 1270,
              "Plan Width": 32,
              "Actual Startup Time": 0.011,
              "Actual Total Time": 0.014,
              "Actual Rows": 11,
              "Actual Loops": 1
          "Node Type": "Sort",
          "Parent Relationship": "Outer",
          "Parallel Aware": false,
          "Startup Cost": 365.83,
          "Total Cost": 365.83,
          "Plan Rows": 1,
          "Plan Width": 64,
          "Actual Startup Time": 0.416,
          "Actual Total Time": 0.436,
          "Actual Rows": 77,
          "Actual Loops": 1,
          "Sort Key": ["sp.geom"],
          "Sort Method": "quicksort",
          "Sort Space Used": 45,
          "Sort Space Type": "Memory",
          "Plans": [
              "Node Type": "Nested Loop",
              "Parent Relationship": "Outer",
              "Parallel Aware": false,
              "Join Type": "Inner",
              "Startup Cost": 0.00,
              "Total Cost": 365.82,
              "Plan Rows": 1,
              "Plan Width": 64,
              "Actual Startup Time": 0.261,
              "Actual Total Time": 0.319,
              "Actual Rows": 77,
              "Actual Loops": 1,
              "Plans": [
                  "Node Type": "Nested Loop",
                  "Parent Relationship": "Outer",
                  "Parallel Aware": false,
                  "Join Type": "Inner",
                  "Startup Cost": 0.00,
                  "Total Cost": 327.72,
                  "Plan Rows": 1,
                  "Plan Width": 32,
                  "Actual Startup Time": 0.258,
                  "Actual Total Time": 0.296,
                  "Actual Rows": 7,
                  "Actual Loops": 1,
                  "Join Filter": "((spu.geom && st_expand(b.geom, '50'::double precision)) AND (b.geom && st_expand(spu.geom, '50'::double precision)) AND _st_dwithin(spu.geom, b.geom, '50'::double precision))",
                  "Rows Removed by Join Filter": 0,
                  "Plans": [
                      "Node Type": "CTE Scan",
                      "Parent Relationship": "Outer",
                      "Parallel Aware": false,
                      "CTE Name": "street_points_union",
                      "Alias": "spu",
                      "Startup Cost": 0.00,
                      "Total Cost": 0.02,
                      "Plan Rows": 1,
                      "Plan Width": 32,
                      "Actual Startup Time": 0.218,
                      "Actual Total Time": 0.219,
                      "Actual Rows": 1,
                      "Actual Loops": 1
                      "Node Type": "CTE Scan",
                      "Parent Relationship": "Inner",
                      "Parallel Aware": false,
                      "CTE Name": "buildings",
                      "Alias": "b",
                      "Startup Cost": 0.00,
                      "Total Cost": 22.60,
                      "Plan Rows": 1130,
                      "Plan Width": 32,
                      "Actual Startup Time": 0.006,
                      "Actual Total Time": 0.012,
                      "Actual Rows": 7,
                      "Actual Loops": 1
                  "Node Type": "CTE Scan",
                  "Parent Relationship": "Inner",
                  "Parallel Aware": false,
                  "CTE Name": "street_points",
                  "Alias": "sp",
                  "Startup Cost": 0.00,
                  "Total Cost": 25.40,
                  "Plan Rows": 1270,
                  "Plan Width": 32,
                  "Actual Startup Time": 0.000,
                  "Actual Total Time": 0.002,
                  "Actual Rows": 11,
                  "Actual Loops": 7
    "Planning Time": 0.249,
    "Triggers": [
    "Execution Time": 57.667

Diferencia en algunos parámetros de pg_settings

Mark Jeronimus Puntos 196

No puedo ver tus explicaciones aparentemente, pero uno de los principales cambios que ralentizan muchas de mis consultas en términos de rendimiento es la optimización CTE.

En postgres 12, el CTE es ahora, si es posible, tratado como una subconsulta, y no como una tabla temporal. Debería intentar cambiar WITH ray AS ( a WITH ray AS MATERIALIZED ( para asegurarse de que el comportamiento es similar al de la versión antigua (computar primero el CTE), de lo contrario el planificador puede querer computar sólo bajo demanda durante el resto de la consulta.

También deberías hacerlo con la consulta que utilizas para tus pruebas.


He reproducido el ejemplo y no tengo ningún problema (postgresql 12.3 / 3.0):

¿Tal vez un problema con la instalación, o los parámetros de postgres?


Se me olvidaba que también tengo un postgres antiguo (10.10/2.4) funcionando, así que he probado esto también en él y sigue sin haber problema (150ms)


No entiendo muy bien lo que pasa, pero como dije, en un servidor grande con parámetros cómodos para postgres no hay problema de rendimiento, no importa la versión. Así que traté de mirar con postgres por defecto (Acabo de ejecutar algunos dockers) con diferentes versiones de postgres y postgis y esto es lo que tengo:

  • 12/3 : problema (>10s)
  • 10/3 : problema (9s)
  • 9,6/3 : sin problemas (150ms)

Mi conjetura es que hay una relación con la paralelización (muchas cosas paralizadas en 10) y los cuellos de botella de memoria que son fáciles de venir cuando se manipulan datos relativamente grandes (geom) en paralelo. Los parámetros por defecto de postgres son realmente demasiado conservadores para postgis saber que muchas cosas se paralelizan y el típico ordenador tiene 8 hilos a su disposición. Puedes mirar esta respuesta que hice donde enumero los parámetros (más explicación de los parámetros aquí ) que suelo cambiar (algunos necesitan reiniciar el servidor).


He comprobado para establecer todos los parámetros que había establecido para la base de datos grande que trabajó en todos los docker postgis, No hizo ninguna diferencia.

Así que he comprobado las librerías en las diferentes versiones, esto es lo que tengo:

Mi suposición es que hay algo con la versión de GEOS (no creo que el proj tenga algo que ver con este problema). Podría estar equivocado y haber pasado por alto algo en los parámetros. No tengo tiempo para probar a cambiar la lib GEOS en el 12 docker, pero creo que vale la pena comprobar.


He visto que había un docker postgis con postgresql 10 y postgis 2.5, así que he probado con él

PostGIS_full_version: POSTGIS="2.5.5" [EXTENSION] PGSQL="100" GEOS="3.7.1-CAPI-1.11.1 27a5e771" PROJ="Rel. 4.9.3, 15 August 2016" GDAL="GDAL 2.1.2, released 2016/10/24" LIBXML="2.9.4" LIBJSON="0.12.1" LIBPROTOBUF="1.2.1" TOPOLOGY RASTER

Para lanzar el docker: docker run --name test_postgis_10_st_25 -e POSTGRES_PASSWORD=mysecretpassword --shm-size=40g --memory="100g" --memory-swap="150g" --memory-swappiness=0 --ulimit memlock=81920000000:81920000000 -d postgis/postgis:10-2.5 -c shared_buffers='25GB' -c effective_cache_size='70GB' -c work_mem='256MB' -c maintenance_work_mem='5GB' -c autovacuum_work_mem='5GB' -c max_connections='1000' -c effective_io_concurrency='200' -c max_worker_processes='24' -c max_parallel_workers='24' -c max_parallel_workers_per_gather='12' -c wal_buffers='16MB' -c min_wal_size='1GB' -c max_wal_size='2GB'

No tenía el error (funciona en 150ms). La misma petición con docker postgis/postgis:10-3.0-alpine terminado en 10s

Realmente creo que hay un problema con GEOS 3.8.1 para esta solicitud


