Evaluating bids

Programa em Java Ocr usando Tesseract

Published on the March 06, 2018 in IT & Programming

About this project

Open

Eu preciso de um programa que converta imagens digitalizadas (tiff e pdf) para um PDF/A pesquisável.
Requerimento:
>> Precisa ser em Java
>> Deve usar Tesseract (port)
>>Precisa gerar um novo documento pesquisável (PDF/A) a partir de imagens digitalizadas
>>O novo PDF gerado deve ser idêntico ao digitalizado com todas as imagens, tabelas, etc.
>>O programa deve ter um único método.
Um parâmetro string com o caminho da imagem e como retorno um novo caminho do PDF/A pesquisável.

No anexo existem dois arquivos de exemplo. Um é um pdf que não é pesquisável chamado de scanned .pdf e o searchable.pdf é  o arquivo com OCR e pesquisável.

VEJA OS ARQUIVOS QU ESTÃO NO EXEMPLO

Category IT & Programming
Subcategory Web development
What is the scope of the project? Small change or bug
Is this a project or a position? Project
I currently have I have specifications
Required availability As needed
Roles needed Developer

Delivery term: Not specified

Skills needed