Sobre este proyecto
it-programming / artificial-intelligence-1
Abierto
Buscamos un profesional con experiencia en Data Engineering y Procesamiento de Lenguaje Natural (NLP) para desarrollar un pipeline de datos completo. El objetivo principal es unificar y normalizar aproximadamente 50.000 páginas de catálogos, que contienen alrededor de 500.000 referencias de productos, en un modelo de datos limpio y estructurado. Este modelo será la base para futuras aplicaciones.
Las responsabilidades incluirán:
- Diseño e implementación de un pipeline de datos robusto para la ingesta, limpieza y transformación de los datos de los catálogos.
- Aplicación de técnicas avanzadas de NLP para la normalización de descripciones de productos, extracción de entidades y estandarización de atributos.
- Desarrollo de algoritmos de segmentación de clientes y sistemas de recomendación basados en el catálogo unificado.
- Integración con nuestro sistema crm para la generación automatizada de ofertas personalizadas (rpa).
- Implementación de funcionalidades de Inteligencia Artificial para procesar pedidos recibidos por correo electrónico y generar propuestas de ofertas personalizadas de manera eficiente.
El candidato ideal deberá tener un profundo conocimiento en la construcción de infraestructuras de datos, experiencia práctica con librerías y frameworks de nlp, y capacidad para integrar soluciones de ia en entornos empresariales existentes. Se valorará la experiencia previa en proyectos de gran volumen de datos y la optimización de procesos de negocio mediante automatización.
Alcance y entregables (criterios de aceptación)
1. Ingesta + normalización (ocr/nlp, deduplicación, taxonomía y atributos) → >98% filas válidas en muestreo. (NLP para catálogos; Módulo de Datos)
2. Segmentación clientes (clustering) + recomendación (content-based/collaborative) con top-N y métricas
3. RPA para generar ofertas/catálogos personalizados desde plantillas.
4. Conectores de lectura/escritura con erp/crm (api o csv automatizado).
5. Documentación + handover (diccionario de datos, pipelines, jobs).
Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Grande
Plazo de Entrega: No definido
Habilidades necesarias