Sobre este projeto
it-programming / artificial-intelligence-1
Aberto
Estamos buscando um desenvolvedor Python experiente para construir um Agente de IA autônomo e seguro, focado em automação de e-mail e consulta de dados empresariais. O objetivo central é transformar solicitações complexas recebidas por e-mail em ações concretas e respostas precisas, utilizando uma arquitetura robusta de Large Language Models (LLMs) e ferramentas de dados.
O projeto envolve a criação de um sistema que:
Orquestra tarefas: O Agente deve raciocinar sobre a solicitação do usuário, planejando uma sequência de passos (Chain of Thought) para resolvê-la.
Executa Ações Programáticas (Tools): Integrar o Agente a Apis externas (soap/rest) e a um banco de dados relacional (com modelagem de fatos/ocorrências) para buscar, filtrar e processar informações empresariais.
Gera Conhecimento Especializado (RAG): Implementar um módulo de Retrieval-Augmented Generation (RAG) para consultar e resumir dados a partir de uma base de conhecimento (documentos internos), garantindo respostas fundamentadas.
Mantém Segurança e Conformidade: Adicionar travas de segurança rigorosas (RBAC) e rotinas de sanitização de dados para proteger informações sensíveis, garantindo que o Agente só atue com permissão e nunca exponha dados confidenciais na resposta.
O profissional trabalhará com LangChain para orquestração e desenvolverá um pipeline pronto para produção em ambiente de cloud, focado em escalabilidade e alta precisão nas respostas automáticas por e-mail.
Abaxio uma lista de requerimentos. Você não precisa ser especialista em tudo, mas precisa ter uma boa noção pois algumas coisas serão exigidas.
Habilidades em Infraestrutura e Escalabilidade
Docker e Docker Compose: Essenciais para empacotar o Agente em containers, garantindo que ele rode de forma consistente em qualquer ambiente (dev/prod).
Kubernetes (K8s) ou Serviços Serverless: Necessário para orquestrar e escalar a aplicação. Em ambiente de e-mail, isso é crucial para lidar com picos de requisições.
Cloud Computing (AWS, Azure ou GCP): Conhecimento em serviços de cloud para hospedar o Agente, o DB e o Pipeline ETL, além de gerenciar custos e segurança.
Filas de Mensagens (ex: Redis Queue, aws sqs): usado para processar e-mails de forma assíncrona. Se 100 e-mails chegarem de uma vez, a fila garante que eles sejam processados um por um, evitando travamentos e rate limiting da api do soc.
Habilidades em RAG (Conhecimento Especializado)
Bancos de Dados Vetoriais: Ferramentas como ChromaDB, Pinecone ou pgvector (no PostgreSQL) para armazenar os documentos de RH (legislação, manuais).
Embeddings (Modelos e Técnicas): Entender como converter o texto (manuais) em vetores numéricos e como escolher um modelo de embedding de alta qualidade para garantir que a busca do conhecimento seja precisa.
Indexação e Chunking: Habilidade em usar Text Splitters (componentes do LangChain) para dividir documentos grandes em pedaços (chunks) que sejam otimizados para a busca semântica do Agente.
Aferição de RAG: Noções básicas de como medir a qualidade do RAG (ex: a resposta do Agente é baseada nos documentos fornecidos? A informação é fiel?).
Habilidades em Segurança e Integração de E-mail
Autenticação e Autorização (rbac/jwt): implementar o role-based access control (rbac) para mapear o e-mail de origem para a permissão do usuário. Isso é o que alimenta sua Tool verificar_permissao.
Integração de E-mail (APIs): Conhecimento em APIs de e-mail (ex: Microsoft Graph API para Outlook/Exchange ou Gmail API) para configurar o backend para "ler" e "responder" a caixa de entrada de forma programática.
Sanitização de Dados (PII): Conhecimento de técnicas de segurança para remover ou mascarar dados sensíveis (CPF, salário, endereço) no Python, garantindo que essas informações nunca cheguem ao LLM ou à resposta final do e-mail.
LGPD e Compliance de RH: Conhecimento dos requisitos de conformidade com a LGPD (Lei Geral de Proteção de Dados) e políticas internas de RH sobre quais dados podem ser expostos.
Habilidades em DevOps e Monitoramento
Tracing e Observabilidade (LangSmith): Uso de ferramentas de tracing (como o LangSmith, específico para LangChain) para rastrear o fluxo de pensamento (Chain of Thought) do Agente. É Crucial para entender por que ele tomou uma decisão errada em um e-mail.
Monitoramento de Custos: Implementar logs para monitorar o consumo de tokens do llm e das chamadas da api, controlando os custos de produção.
Versionamento de Código (Git): Uso avançado do Git para gerenciar as versões do Agente e do pipeline de dados.
Contexto Geral do Projeto
Agente de IA Autônomo para Automação de Comunicações e Análise de Dados
Buscamos um especialista em desenvolvimento de Agentes de IA para construir um sistema autônomo que opera diretamente em canais de comunicação, como e-mail.
O projeto principal é desenvolver um Agente que raciocina sobre entradas textuais, executa consultas complexas em um Banco de Dados Empresarial (alimentado via pipeline ETL), e gera respostas precisas ou inicia ações transacionais automaticamente.
Além disso, o Agente será responsável pela análise proativa e periódica do banco de dados, identificando inconsistências críticas e gerando alertas inteligentes baseados em regras de negócio predefinidas. Este é um papel central na automação de processos críticos e na garantia da qualidade dos dados.
Categoria TI e Programação
Subcategoria Inteligência Artificial
Tamanho do projeto Médio
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário
Prazo de Entrega: 30 de Novembro de 2025
Habilidades necessárias