Realizado

Patrick Acioli - Projeto: Sistema Inteligente de Ocr para Documentos Diversos

Publicado em 12 de Maio de 2025 dias na TI e Programação

Sobre este projeto

Aberto

Estamos em busca de profissionais qualificados para o desenvolvimento de um sistema robusto de OCR (Reconhecimento Óptico de Caracteres). O objetivo do projeto é criar uma solução capaz de realizar a extração de texto de forma eficiente e precisa a partir de qualquer tipo de documento, seja ele impresso ou digitalizado.
Requisitos principais do sistema:
Realizar ocr de documentos variados (contratos, faturas, cnh, rg, boletos, formulários, laudos, etc.).
Suporte a múltiplos formatos de entrada (pdf, jpg, png, entre outros).
Detecção e extração inteligente de informações (nome, cpf, cnpj, datas, valores, etc.), Com possibilidade de treinar modelos para documentos específicos.
Arquitetura modular, com possibilidade de integrar novos tipos de documentos e campos de forma simples.
Interface de upload com pré-visualização dos dados extraídos.
API para integração com outros sistemas.
Capacidade de executar localmente (on-premises) ou na nuvem.
Suporte a múltiplos idiomas (preferencialmente com foco inicial em português).
Alta acurácia na extração, mesmo em documentos com baixa qualidade de imagem.
Diferenciais desejados:
Experiência com bibliotecas de OCR como Tesseract, EasyOCR, Google Vision ou Amazon Textract.
Conhecimento em visão computacional e NLP para estruturação dos dados extraídos.
Aplicação de machine learning para ajuste fino de resultados e validação de campos.
Estamos abertos a sugestões técnicas e propostas de arquitetura. O projeto pode evoluir para um sistema especialista com modelos treinados para tipos específicos de documentos, mas o objetivo inicial é garantir a flexibilidade e abrangência do OCR.

Categoria TI e Programação
Subcategoria Programação

Prazo de Entrega: Não estabelecido

Outro projetos publicados por L. B. F.