Evaluating bids

Conversor campos Pdf para Xml via Ocr

Published on the January 08, 2020 in IT & Programming

About this project

Open

Trata-se de desenvolver um programa leitor (ocr) de pdf e converter os campos e seus valores em um esquema xml padrão.

Entrega necessária
- converter campos do pdf em xml padrão com exatidão, não podendo haver distorções de leitura.
- O usuário deve poder escolher quais campos do pdf input irão para determinados campos do xml output, para o cadastro prévio do layout.
- Ler arquivos pdf a partir de uma pasta, e executar o código de transformação automaticamente.

Entrega ideal
o usuário deve poder criar novos layouts de pdf no próprio programa, sem necessidade de novos pedidos de atualização no executável. O xml do output, e seus campos, permanecem o mesmo

dados do projeto
estimativa de 51 layouts para começar a transformar a xml. Pode chegar a 5000 layouts (total de municípios no brasil)
já temos o esquema do xml "output".


Nos anexos estão 4 modelos de pdf para serem convertidos no esquema do xml anexo. Note que tem a versão pdf do xml também (arquivo com número 388207)

Category IT & Programming
Subcategory Web development
What is the scope of the project? Medium-sized change
Is this a project or a position? Project
I currently have I have specifications
Required availability As needed
API Integrations Other (Other APIs)
Roles needed Developer, Other
Other roles needed python, OCR, nota fiscal de serviço, PDF, xml

Delivery term: January 03, 2020

Skills needed