Sobre este projeto
it-programming / web-development
Aberto
Estou buscando um desenvolvedor para criar um robô de extração de dados públicos a partir de um portal institucional , que não exige login e possui documentos disponíveis em PDF.
O objetivo é automatizar o seguinte fluxo:
Acessar a listagem no portal
Entrar em cada intem individualmente
Fazer o download de um documento PDF (disponível publicamente)
Ler o conteúdo do PDF e extrair informações específicas
Salvar esses dados organizadamente em uma planilha (Google Sheets ou Excel)
✅ Requisitos técnicos desejáveis:
Robô em Python (Selenium, BeautifulSoup ou equivalente)
Leitura automatizada de PDF (PyPDF2, pdfminer, Tika ou outro)
Integração com Google Sheets (via API) ou exportação em Excel/CSV
O robô deve rodar 1x por dia automaticamente (pode ser agendado com cron ou outro método)
🎯 Entrega esperada:
Robô funcional
Código-fonte com instruções de uso
Planilha gerada com os campos definidos
Explicação básica para agendamento automático ou execução manual
📝 Observações:
O portal é público e estável
Os dados coletados são de domínio público
O uso será apenas interno e analítico
Detalhes como URL e amostras de PDF serão fornecidos após a primeira conversa
📩 Propostas:
Por favor, envie:
Seu portfólio (se possível, com projetos parecidos)
Valor total estimado
Prazo para entrega da primeira versão funcional
Contato direto para dúvidas rápidas:
Ronaldo Dutra
Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Alteração média
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário
Funções necessárias Desenvolvedor
Prazo de Entrega: Não estabelecido
Habilidades necessárias