Evaluando propuestas

Desenvolvimento de parser Pdf para extração de dados conforme modelo

Publicado el 14 Junio, 2023 en Programación y Tecnología

Sobre este proyecto

Abierto

Preciso de um desenvolvedor para desenvolvimento do projeto abaixo:

Um parser pdf que extraia dados dos documentos.

Esse parser deve identificar determinados padrões configuráveis nos documentos.

Tomando como exemplo um recibo de pagamento de salário e o parser deve ser capaz de:
1 - Identificar a empresa pagadora;
2 - Identificar o CNPJ da empresa pagadora;
3 - Identificar o recebedor;
4 -  Identificar o CPF do recebedor;
5 - Identificar a competência;
6 - Identificar o valor liquido do recebimento;

Os campos a serem identificados devem ser personalizáveis ou cadastráveis através de algum tipo de interface para que seja possível cadastro de outros tipos de documentos.

Creio que a solução seja extrair todo o texto do documento e em seguida analisa-lo em busca de padrões regex.

O retorno deve ser em json formatado contendo apenas os dados indexados e o caminho do arquivo.

Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Bug o cambio pequeño
¿Es un proyecto o una posición? No lo sé aún
Actualmente tengo Tengo una idea
Disponibilidad requerida Según se necesite
Experiencia en este tipo de proyectos Sí (He administrado este tipo de proyectos anteriormente)
Integraciones de API Cloud Storage (Dropbox, Google Drive, etc.), Otros (Otras APIs)
Roles necesarios Programador

Plazo de Entrega: No definido

Habilidades necesarias

Otros proyectos publicados por R. A.