Evaluando propuestas

Desarrollo de Pipelines de datos con Llm + Rag para Software de Construcción

Publicado el 27 Mayo, 2026 en Programación y Tecnología

Sobre este proyecto

Abierto

En Conprojecto contamos con una base ya establecida construida sobre el framework IA Mastra, con Claude como LLM principal. Buscamos extender esta base con un pipeline de procesamiento documental robusto e incorporar capacidades de RAG a nuestra plataforma de control financiero para la industria de la construcción en Chile.
═══════════════════════════════════════════
alcance del proyecto

pipeline de ingesta asíncrona

- procesamiento de archivos pdf y docx
- desarrollo de herramientas
- orquestación mediante agentes llm (claude) con prompts bien definidos para extracción estructurada
- manejo de colas (bullmq), reintentos y observabilidad sobre el estado del procesamiento


persistencia dual

- base de datos relacional/operacional para los datos extraídos estructurados (uso general de la aplicación)
- base de datos vectorial para el sistema rag


soporta implementación de rag
se debe optimizar este apartado para minimizar costos sacrificando mínimamente la calidad de recuperación. Esperamos que el postulante tenga criterio sobre:

- Selección del modelo de embeddings
- Dimensionalidad de embeddings adecuada al caso de uso
- Estrategia de chunking de documentos



═══════════════════════════════════════════
STACK ACTUAL

Framework: Mastra
LLM: Claude (API de Anthropic)

═══════════════════════════════════════════
LO QUE VALORAMOS

Experiencia previa con la API de Claude (uso de tools, structured outputs, prompt caching)
Experiencia con Mastra (deseable)
Diseño de pipelines asíncronos en producción
Criterio sobre arquitecturas RAG y optimización de costos en proyectos con LLMs

═══════════════════════════════════════════
PARA POSTULAR, SE VALORA

Portfolio o GitHub con proyectos relevantes
Experiencia con LLMs, profesional o personal (proyectos propios, side-projects y experimentación son bienvenidos)
Propuestas técnicas sobre cómo abordarías el proyecto (bienvenidas, no excluyentes)

Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Grande

Plazo de Entrega: No definido

Habilidades necesarias

Otros proyectos publicados por P.