Evaluando propuestas

Desenvolvimento de Programa para Extração de Dados e Imagens de Pdfs Rpi para Json e Azure

Publicado el 02 Septiembre, 2025 en Programación y Tecnología

Sobre este proyecto

Abierto

Busca-se um profissional para desenvolver um programa robusto e eficiente capaz de processar arquivos PDF de grande volume, especificamente a "Revista da Propriedade Industrial - RPI". O objetivo principal é automatizar a extração de informações textuais e visuais desses documentos.

As funcionalidades esperadas do programa incluem:
- Leitura e parsing de arquivos PDF complexos que contêm tanto texto quanto imagens.
- Extração precisa de dados textuais, que deverão ser transformados e padronizados em formato JSON.
- Extração de imagens contidas nos PDFs, com cada imagem sendo salva individualmente e nomeada de acordo com o número do processo associado.

O programa deverá ser inicialmente executável em um ambiente Windows local (máquina física). Adicionalmente, é fundamental que o programa seja projetado para permitir sua alocação e execução em um serviço Azure, replicando o mesmo procedimento de processamento de arquivos em um ambiente de nuvem.

Será fornecido um exemplar da Revista da Propriedade Industrial (RPI) para análise e compreensão da estrutura do documento, podendo ser baixado através do site https://revistas.inpi.gov.br/pdf/Marcas2852.pdf.

Categoría Programación y Tecnología
Subcategoría Aplicaciones de escritorio
¿Cuál es el alcance del proyecto? Crear una aplicación nueva

Plazo de Entrega: No definido

Habilidades necesarias

Otros proyectos publicados por O.