Estamos desenvolvendo um agente de atendimento inteligente para uma clínica, capaz de interagir com pacientes por texto (WhatsApp Web) e também realizar/atender ligações telefônicas através de um ramal SIP (Asterisk).
O foco é criar uma solução 100% local, sem custos de uso por minuto ou APIs pagas, utilizando ferramentas open-source e arquitetura modular, que possa ser replicada para outros clientes futuramente.
Objetivos do projeto
Criar um agente de IA humanizado, capaz de:
Responder mensagens recebidas no WhatsApp Web de forma natural e personalizada.
Realizar e atender ligações telefônicas via ramal SIP, mantendo um diálogo coerente.
Identificar quando deve transferir a conversa para um humano (via número de plantão).
Desenvolver tudo de forma local e escalável, rodando em VMs independentes (uma por cliente).
Permitir configuração e treinamento simples, via arquivo yaml/json, sem necessidade de programar.
Escopo Técnico
O projeto deve conter:
Camada de Inteligência (IA Local)
LLM local (ex: Ollama + Llama 3) para processar e gerar respostas;
Treinamento configurável por YAML (regras, estilo de fala, contexto da clínica);
Capacidade de manter contexto da conversa (memória curta).
Módulo de Mensagens (WhatsApp Web)
Detecção de mensagens novas (texto e áudio);
Leitura e envio de mensagens via automação visual (PyAutoGUI + OCR);
Envio de áudios gerados via TTS;
Ações simulando comportamento humano (delays, digitação, pausas).
Módulo de Voz / Ligações
Integração com ramal SIP (Asterisk ou FreePBX);
Capacidade de:
Atender ligações automaticamente;
Falar usando TTS local (Coqui TTS ou Piper);
Ouvir e compreender usando STT local (
Whisper.cpp ou Vosk);
Responder em tempo real, mantendo uma conversa natural;
Redirecionar a chamada para um número humano se necessário ou finalizar com eduçação e enviar um whatsapp para um responsável humano.
⚙️ Infraestrutura e Orquestração
Cada cliente roda em uma VM independente (Ubuntu ou Windows);
Arquitetura modular (cada módulo = um microserviço local);
Configuração centralizada via arquivo yaml/json
este projeto é uma (poc: proof of concept), propostas acima de 1000 brl, não serão analisadas.
O parceiro deverá levar em consideração que após a implementação ele terá a oportunidade de atuar no time e ter uma receita recorrente para cada projeto que poderá ser replicável caso dê certo em nossa clínica.
Prazo de Entrega: Não estabelecido