Se requiere el desarrollo de un sistema robusto para automatizar la descarga de documentos desde el portal de la Agencia de Aduana, procesar la información contenida en ellos y generar reportes consolidados en formato Excel. El objetivo principal es optimizar la gestión de documentos y la extracción de datos clave para análisis.
Componentes clave del sistema:
1. Autenticación automática: El sistema deberá iniciar sesión en el portal de la Agencia de Aduana utilizando credenciales proporcionadas por el cliente. Se valorará la experiencia con herramientas de automatización web como Python con Selenium o
Node.js con Puppeteer.
2. Descarga de documentos: Una vez autenticado, el sistema navegará a las secciones pertinentes del portal para identificar y descargar los documentos necesarios. Se espera que el sistema sea adaptable a diferentes formatos de documentos (pdf, xml, excel, etc.).
3. Procesamiento de documentos: Se implementará la extracción de datos específicos y clave de los documentos descargados, tales como número de D.U.A., Fecha, monto, tipo de operación, entre otros. Para esto, se considerará el uso de parsers de PDF (ej. Pdfplumber, PyMuPDF, Tabula), OCR para documentos escaneados (ej. Tesseract) y parsers de Excel (ej. Openpyxl, pandas).
4. Generación de reporte: Los datos extraídos se consolidarán en un archivo Excel, el cual deberá ser formateado adecuadamente, incluyendo filtros, totales y otras funcionalidades para facilitar el análisis. Se sugiere el uso de pandas con xlsxwriter.
5. Interfaz de usuario (opcional): Aunque no es un requisito inicial, se valora la capacidad de proponer o desarrollar una interfaz de usuario, ya sea una aplicación web (utilizando frameworks como Flask, Django, FastAPI con React/Vue) o una aplicación de escritorio (con Electron, PyQt).
Consideraciones de seguridad:
El desarrollo debe incluir un manejo seguro de las credenciales, idealmente cifradas o mediante la implementación de OAuth si el portal lo permite. Además, se requiere la validación de acceso por cliente y la implementación de logs detallados de actividad y errores para asegurar la trazabilidad y el mantenimiento del sistema.
Plazo de Entrega: No definido