Terminado

Extracción y actualización diaria de datos públicos de contratación del Gobierno de España

Publicado el 23 Abril, 2025 en Programación y Tecnología

Sobre este proyecto

Abierto

Buscamos un desarrollador freelance para automatizar la descarga, transformación y almacenamiento en base de datos de los datos abiertos de contratación pública del Gobierno de España.

Estos datos están disponibles en formato XML a través de URLs públicas, y contienen información detallada sobre concursos públicos (expedientes de contratación), cada uno identificado con un ID único.

Alcance del trabajo:
Lectura e interpretación de XMLs públicos:

Se debe desarrollar un proceso (job o script) que acceda diariamente a las fuentes públicas del Gobierno de España (se proporciona documentación técnica en PDF).

El script debe detectar nuevas publicaciones o modificaciones en concursos existentes y reflejarlo en la base de datos.

Si un expediente ya existe en la base de datos, se deberá actualizar su información (reemplazando la anterior) o actualizar campos específicos, según se defina técnicamente.

Importación histórica:

El sistema de contratación pública lleva años en funcionamiento. Se deberá desarrollar un proceso de carga inicial completa, que lea todos los XMLs históricos y almacene la información en una base de datos MySQL.

Base de datos:

Toda la información deberá almacenarse en una base de datos MySQL, siguiendo un modelo estructurado y optimizado para consultas posteriores (por ejemplo, por fecha, tipo de contrato, adjudicatario, etc.).

Automatización:

El proceso debe ejecutarse de forma diaria de manera automática, ya sea mediante cron jobs u otro sistema.

Documentación:

El código debe estar debidamente comentado.

Se requiere documentación mínima sobre la estructura de la base de datos y cómo ejecutar los procesos.

Requisitos técnicos:
Experiencia trabajando con XMLs, parsing y transformación de datos.

Conocimientos en bases de datos relacionales (MySQL).

Experiencia en automatización de tareas con scripts o cron jobs.

Se valorará experiencia previa trabajando con datos abiertos o proyectos similares.

Archivos adjuntos:
Se incluye un PDF con la información técnica oficial sobre cómo se publican los datos, estructura de los XMLs y detalles técnicos clave.

Entregables:
Script o servicio de carga inicial completa (histórica).

Script o servicio de actualización diaria.

Estructura de la base de datos MySQL implementada.

Documentación técnica básica.

Contexto general del proyecto

El objetivo de este proyecto es desarrollar un sistema automatizado que nos permita obtener, estructurar y actualizar diariamente la información pública de concursos de contratación del Estado español, publicada en formato XML a través de fuentes oficiales del Gobierno de España. Esta información es parte del sistema de datos abiertos y resulta fundamental para el análisis y seguimiento de las contrataciones públicas en el país. ¿Por qué queremos este desarrollo? Queremos centralizar en una base de datos MySQL toda la información de contratación pública desde el inicio del sistema hasta la actualidad, para luego utilizar estos datos en herramientas internas de análisis e inteligencia de negocio. ¿Qué esperamos del sistema? Una carga inicial completa de toda la información histórica publicada. Un proceso automático diario que revise si hay nuevos concursos o actualizaciones en concursos ya existentes, y actualice nuestra base de datos en consecuencia. Flexibilidad para adaptarse a futuros cambios en la estructura XML o la lógica de publicación de los datos. En el archivo adjunto se encuentra la documentación técnica oficial en pdf, que explica cómo acceder a los datos, su estructura en xml y el uso de los identificadores únicos de cada expediente.

Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Crear un nuevo sitio personalizado
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo las especificaciones
Disponibilidad requerida Según se necesite
Roles necesarios Programador

Plazo de Entrega: 12 Mayo, 2025

Habilidades necesarias