Sobre este proyecto
it-programming / data-science-1
Abierto
Buscamos un especialista para liderar la implementación de un sistema robusto para la lectura, captación, cohesión y calificación de un gran volumen de documentos. El proyecto implica el procesamiento de aproximadamente 6.000 archivos PDF.
Las responsabilidades clave incluyen:
- Lectura y categorización de documentos: Organizar documentos por tipo (documentación técnica, fichas de producto, fichas de calidad, contratos de clientes, etc.).
- Extracción de datos estructurados mediante OCR: Implementar y configurar una solución ocr, preferiblemente utilizando aws textract, para extraer información clave de los pdfs.
- Validación de datos: Desarrollar procesos para identificar errores, campos vacíos o inconsistencias en los datos extraídos, marcando los documentos en incidencia.
- Clasificación y almacenamiento de información: Clasificar la información relevante y almacenarla en una base de datos.
- Integración con QMS: Preparar la documentación y los datos para su posterior archivado y gestión en un sistema de gestión de calidad (QMS).
El objetivo principal es escanear, leer e identificar los datos de referencia de los documentos, así como cualquier incidencia, para su almacenamiento eficiente en un gestor QMS. Se requiere una persona con experiencia en la implantación de herramientas de procesamiento documental y que pueda ofrecer acompañamiento técnico durante todo el ciclo del proyecto.
Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Grande
Plazo de Entrega: No definido
Habilidades necesarias