Analisando propostas

Desenvolvimento de Sistema de Automação para Extração de Dados de Pedidos Amazon em Pdf

Publicado em 14 de Outubro de 2025 dias na TI e Programação

Sobre este projeto

Aberto

O objetivo deste projeto é desenvolver um sistema ou rotina automatizada capaz de processar arquivos PDF de pedidos da Amazon. Cada PDF pode conter múltiplas páginas, e cada página corresponde a um pedido individual. O sistema deverá extrair dados específicos dos pedidos e gerar dois tipos de arquivos de saída:

1. Um arquivo TXT formatado:
  - A lista deve seguir o formato: "N/XXX - Qtd unid Nome do Produto - Marca (Peso)".
  - O número N/xxx deve ser extraído do rodapé do pdf.
  - Se houver mais de um produto na mesma página, eles devem ser listados como subitens (A, B, C, etc.).

2. Um arquivo Excel (XLSX) com um resumo dos produtos:
  - Os produtos devem ser agrupados, e a quantidade total de cada produto somada.
  - Exemplo: "Nome do Produto – Quantidade Total unid".

Detalhes Técnicos:
- Os PDFs possuem rodapés no formato N/xxx (ex: 01/100, 04/56), que devem ser utilizados na formatação do arquivo txt.
- A extração de dados deve focar no conteúdo entre as palavras "Quantidade" e "Subtotal do produto/Total do produto/Obrigado por comprar", ignorando outros textos como endereços ou códigos de pedido.
- O sistema deve ser capaz de identificar e juntar corretamente nomes de produtos que se estendem por várias linhas.
- A saída final de todos os arquivos deve ser em formato UTF-8 para garantir a correta exibição de caracteres especiais e acentos.

Requisitos do Profissional:
- Experiência comprovada em Python ou outras linguagens de programação com foco em automação e processamento de documentos (ex: Java, Node.js).
- Conhecimento e experiência com bibliotecas de manipulação de PDF (ex: PyMuPDF, pdfplumber ou similares) para extração de texto e dados.
- Habilidade para gerar e manipular arquivos Excel (XLSX) utilizando bibliotecas como pandas, openpyxl ou equivalentes.
- O código entregue deve ser bem documentado para facilitar a compreensão e futuras manutenções.

Diferenciais (desejáveis, mas não obrigatórios):
- Criação de um atalho simples no Windows (ex: arquivo .bat) que permita arrastar e soltar o PDF para iniciar o processamento.
- Desenvolvimento de uma interface gráfica simples para seleção e processamento dos PDFs.
- Capacidade de processar múltiplos PDFs em lote (uma pasta inteira).

Entregáveis:
- Código-fonte completo do programa.
- Instruções detalhadas de instalação e uso passo a passo, adequadas para um usuário leigo.
- Um pacote de testes contendo 1 ou 2 Pdfs de exemplo com suas respectivas saídas txt e xlsx convertidas corretamente.

Categoria TI e Programação
Subcategoria Aplicativos desktop
Qual é o alcance do projeto? Criar um novo aplicativo

Prazo de Entrega: Não estabelecido

Habilidades necessárias