ETL
El ETL Georef es el proyecto encargado de generar los activos de datos que son indexados y publicados por la API. A través de este proceso se producen archivos estructurados que contienen información oficial y georreferenciada sobre entidades geográficas de la República Argentina.
El producto final del ETL consiste en una serie de archivos en distintos formatos:
- Archivos en formato NDJSON, utilizados por la API para indexar entidades geográficas.
- Archivos en formatos de descarga pública (CSV, JSON, GeoJSON), disponibles para usuarios que necesiten acceder a la totalidad de los datos.
Todos los archivos pueden descargarse desde el portal datos.gob.ar, donde están organizados bajo la distribución del Servicio de normalización de direcciones y unidades territoriales de Argentina.
Las siguientes secciones detallan:
- La estructura común de los archivos NDJSON, incluyendo su formato, campos y geometrías.
- Los pasos para instalar y ejecutar el ETL en un entorno propio, permitiendo reproducir o personalizar el proceso de generación de datos.
El código fuente del proyecto ETL es público y está disponible en GitHub.