Evaluating bids

Ocr para Pdf'S y Extracción de contenido

Published on the April 05, 2021 in IT & Programming

About this project

Open

El proyecto consiste en procesar pdf's (Algunos vienen bien estructurados en texto , otros son escaneados y deben ser pasados por un OCR) , buscar unas palabras claves apartir de logica difusa (https://es.wikipedia.org/wiki/L%C3%B3gica_difusa) (Ya que los pdf's cambian su estructura dependiendo de la entidad que publica la dicho pdf) y posterior a eso extraer el bloque de contenido deseado.

Pensamos que es util implementar matching learning para el aprendizaje de donde sacar cada item por cada pdf o almenos la pragmatica que debe tener el sistema.

Project overview

- Se debe tener un API para enviar el documento + campos y que este responda en json con los campos extraidos - Debe ser compatible con linux, ya que el código fuente correrá sobre un centos 7

Category IT & Programming
Subcategory Other
Project size Medium
Is this a project or a position? Project
I currently have I have specifications
Required availability As needed

Delivery term: Not specified

Skills needed