Modelo de datos para Georef
El proceso ETL (Extracción, Transformación y Carga) de Georef tiene como objetivo generar los archivos de datos que alimentan los distintos recursos de la API. El resultado de este proceso son varios archivos que contienen información estructurada sobre entidades geográficas de la República Argentina.
Existen dos grandes grupos de archivos generados:
- Archivos de indexación para la API, en formato NDJSON
- Archivos de descarga pública, en formato CSV, JSON o GeoJSON
Estos archivos se actualizan periódicamente y pueden descargarse desde el portal de datos abiertos de la Administración Pública Nacional. Para procesamiento masivo o análisis detallado, se recomienda trabajar con los archivos NDJSON, ya que permiten la lectura por líneas, lo que facilita su manipulación sin necesidad de cargarlos completamente en memoria. Además, es el único formato que incluye las geometrías oficiales.