Buscamos um desenvolvedor qualificado para criar um sistema automatizado focado no processamento, manipulação e integração de dados extraídos de documentos padronizados. O objetivo principal é otimizar fluxos de trabalho que envolvem a leitura de informações, sua modificação programática e o envio subsequente para plataformas externas via API. A solução deve ser robusta, segura e eficiente.
Funcionalidades Chave:
1. Processamento de Documentos
O sistema deverá ser capaz de:
Extração Inteligente de Dados: Identificar e extrair campos de dados específicos de documentos semi-estruturados (por exemplo, arquivos PDF com layouts consistentes ou formulários digitais). A precisão na extração é crucial.
Manipulação de Conteúdo Programática: Permitir a alteração programática dos dados extraídos com base em regras de negócio predefinidas. Isso inclui a capacidade de formatar, recalcular ou substituir informações dentro dos campos identificados.
Geração/Atualização de Documentos: Após a manipulação dos dados, o sistema deve ser capaz de gerar novos documentos ou atualizar os documentos originais, incorporando as modificações realizadas, mantendo a integridade do formato e layout.
2. Integração de Dados e Segurança
Conectividade com APIs Externas: Desenvolver módulos para integração com APIs de terceiros, permitindo o envio seguro dos documentos processados ou dos dados extraídos para serviços de armazenamento em nuvem ou outras plataformas digitais.
Mecanismos de Autenticação: Implementar protocolos de segurança robustos para autenticação e autorização ao interagir com as APIs e serviços externos, garantindo a proteção dos dados em trânsito e em repouso.
Linguagem de Programação: Preferência por Python ou
Node.js, dada a vasta disponibilidade de bibliotecas para manipulação de documentos e integração de APIs.
Bibliotecas/Frameworks: Experiência com bibliotecas de manipulação de PDF (ex: PyPDF2, ReportLab para Python; pdf-lib, puppeteer para
Node.js) é essencial.
Prazo de Entrega: Não estabelecido