Sobre este proyecto
it-programming / web-development
Abierto
Se requiere el desarrollo de un web scraper robusto y automatizado para extraer diariamente información sobre empresas sancionadas publicada en el Boletín Oficial del Estado (BOE) a nivel estatal. El objetivo principal es obtener estos datos de forma estructurada para su posterior integración en un sistema CRM. El freelancer deberá:
* Diseñar y desarrollar un scraper capaz de navegar por el sitio web del BOE y localizar las publicaciones relevantes sobre sanciones a empresas.
* Extraer datos clave como el nombre de la empresa, detalles de la sanción, fecha de publicación, y cualquier otro identificador relevante.
* Implementar la lógica para que el scraper se ejecute diariamente de forma autónoma.
* Asegurar que los datos extraídos estén limpios y en un formato adecuado (por ejemplo, csv, json o a través de una api) para facilitar su importación al crm.
* Considerar la gestión de posibles cambios en la estructura del sitio web del BOE y la implementación de mecanismos de reintento y manejo de errores.
Se busca un profesional con experiencia en web scraping y manejo de datos, preferiblemente con conocimientos en integración de sistemas.
Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Crear un nuevo sitio personalizado
Plazo de Entrega: No definido
Habilidades necesarias