Realizado

Robô para Extração de Dados Públicos em Site com Pdf

Publicado em 18 de Abril de 2025 dias na TI e Programação

Sobre este projeto

Aberto

Estou buscando um desenvolvedor para criar um robô de extração de dados públicos a partir de um portal institucional , que não exige login e possui documentos disponíveis em PDF.

O objetivo é automatizar o seguinte fluxo:

Acessar a listagem no  portal

Entrar em cada intem individualmente

Fazer o download de um documento PDF (disponível publicamente)

Ler o conteúdo do PDF e extrair informações específicas


Salvar esses dados organizadamente em uma planilha (Google Sheets ou Excel)

✅ Requisitos técnicos desejáveis:
Robô em Python (Selenium, BeautifulSoup ou equivalente)

Leitura automatizada de PDF (PyPDF2, pdfminer, Tika ou outro)

Integração com Google Sheets (via API) ou exportação em Excel/CSV

O robô deve rodar 1x por dia automaticamente (pode ser agendado com cron ou outro método)

🎯 Entrega esperada:
Robô funcional

Código-fonte com instruções de uso

Planilha gerada com os campos definidos

Explicação básica para agendamento automático ou execução manual

📝 Observações:
O portal é público e estável

Os dados coletados são de domínio público

O uso será apenas interno e analítico

Detalhes como URL e amostras de PDF serão fornecidos após a primeira conversa

📩 Propostas:
Por favor, envie:

Seu portfólio (se possível, com projetos parecidos)

Valor total estimado

Prazo para entrega da primeira versão funcional

Contato direto para dúvidas rápidas:
Ronaldo Dutra

Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Alteração média
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário
Funções necessárias Desenvolvedor

Prazo de Entrega: Não estabelecido

Habilidades necessárias