Evaluating bids

Projeto Ocr - Reconhecimento de Imagem em texto via Php

Published on the September 14, 2016 in IT & Programming

About this project

Open

Projeto OCR - Reconhecimento de Texto em Imagem em linguagem PHP

Tesseract é uma biblioteca para linux, que transforma imagens em texto.
Ela é free e tem disponível na internet. Por linha de comando ela pega imagem
e entrega o resultado em um arquivo texto.

Qual trabalho vai ser realizado:

Instalar Tesseract em servidor Linux.
Instalar ftp/apache/php
criar usuario ftp para enviar imagens
criar um script (de linux ou php shell, tanto faz) para rodar as imagens em fila no teserract
criar rotina em php que vai dar update e atualizar o resultado em texto do teserract em um banco de dados mysql remoto.
São imagens de encarte de supermercados com promoção de produtos.

Descrição do Processo:

1 - Vamos enviar imagens via FTP para o servidor instalado com tesseract ou informar endereços de sites específicos de encartes e o sistema deve identificar os folders encartes e pegar os dados.
2 - Os dados a serem identificados e gravados no banco são cod produto, através do cod a imagem do produto, valor, data de inicio e termino da promoção, endereço completo do estabelecimento e etc...
3 - Um script rodando automaticamente, vai dectectar novas imagens no diretorio.
4 - Teressact que vai transformar a imagem em texto em fila. Para o servidor suportar pois não é ideal em paralelo.
5 - Esse Resultado em texto deverá ser inserido em um banco de dados remoto mysql por "UPDATE"

Site em formato de dashboard com gráficos por região media de preço e pesquisa por produto e localidade.

Category IT & Programming
Subcategory Web development
What is the scope of the project? Create a new custom site
Is this a project or a position? Project
I currently have I have an idea
Required availability As needed
Experience in this type of projects No (I haven’t managed this kind of project before)
Roles needed Developer

Delivery term: Not specified

Skills needed