Evaluando propuestas

Conversor campos Pdf para Xml via Ocr

Publicado el 08 Enero, 2020 en Programación y Tecnología

Sobre este proyecto

Abierto

Trata-se de desenvolver um programa leitor (ocr) de pdf e converter os campos e seus valores em um esquema xml padrão.

Entrega necessária
- converter campos do pdf em xml padrão com exatidão, não podendo haver distorções de leitura.
- O usuário deve poder escolher quais campos do pdf input irão para determinados campos do xml output, para o cadastro prévio do layout.
- Ler arquivos pdf a partir de uma pasta, e executar o código de transformação automaticamente.

Entrega ideal
o usuário deve poder criar novos layouts de pdf no próprio programa, sem necessidade de novos pedidos de atualização no executável. O xml do output, e seus campos, permanecem o mesmo

dados do projeto
estimativa de 51 layouts para começar a transformar a xml. Pode chegar a 5000 layouts (total de municípios no brasil)
já temos o esquema do xml "output".


Nos anexos estão 4 modelos de pdf para serem convertidos no esquema do xml anexo. Note que tem a versão pdf do xml também (arquivo com número 388207)

Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Cambio mediano
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo las especificaciones
Disponibilidad requerida Según se necesite
Integraciones de API Otros (Otras APIs)
Roles necesarios Programador, Otro
Otros roles necesarios python, OCR, nota fiscal de serviço, PDF, xml

Plazo de Entrega: 03 Enero, 2020

Habilidades necesarias