Analisando propostas

Conversor campos Pdf para Xml via Ocr

Publicado em 08 de Janeiro de 2020 dias na TI e Programação

Sobre este projeto

Aberto

Trata-se de desenvolver um programa leitor (ocr) de pdf e converter os campos e seus valores em um esquema xml padrão.

Entrega necessária
- converter campos do pdf em xml padrão com exatidão, não podendo haver distorções de leitura.
- O usuário deve poder escolher quais campos do pdf input irão para determinados campos do xml output, para o cadastro prévio do layout.
- Ler arquivos pdf a partir de uma pasta, e executar o código de transformação automaticamente.

Entrega ideal
o usuário deve poder criar novos layouts de pdf no próprio programa, sem necessidade de novos pedidos de atualização no executável. O xml do output, e seus campos, permanecem o mesmo

dados do projeto
estimativa de 51 layouts para começar a transformar a xml. Pode chegar a 5000 layouts (total de municípios no brasil)
já temos o esquema do xml "output".


Nos anexos estão 4 modelos de pdf para serem convertidos no esquema do xml anexo. Note que tem a versão pdf do xml também (arquivo com número 388207)

Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Alteração média
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Eu tenho especificações
Disponibilidade requerida Conforme necessário
Integrações de API Outros (Outras APIs)
Funções necessárias Desenvolvedor, Outro
Outras funções necessárias python, OCR, nota fiscal de serviço, PDF, xml

Prazo de Entrega: 03 de Janeiro de 2020

Habilidades necessárias