1. ARQUITETURA E stack sugerida
backend:
node.js (TypeScript) ou Python (FastAPI/Django).
Banco de Dados: PostgreSQL (Relacional para auditoria e logs).
Integrações: WhatsApp (Evolution API / WPPConnect), API Gov (já disponível), OCR (Google Vision ou AWS Textract).
Infraestrutura: AWS ou Google Cloud (Compliance com LGPD).
2. Módulos do sistema
módulo a: onboarding inteligente (ia "ana")
o sistema deve gerenciar conversas via whatsapp agindo como um agente de triagem.
Função: Coleta de dados (CPF, Foto do documento, E-mail).
Persistência: O bot deve manter o estado da conversa (Finite State Machine). Se o aluno parar o envio, o sistema deve disparar gatilhos de recuperação em 15m, 6h e 24h.
Webhook: O sistema deve notificar o banco de dados a cada etapa concluída.
Módulo B: Motor de Identidade e OCR
Comparação entre a imagem enviada e a base oficial.
Tarefa: Extrair via OCR os campos: Nome, Nome da Mãe, Data de Nascimento, Número do rg e uf.
Lógica de Validação (Cascata):
Comparar RG_OCR com RG_API_GOV.
Caso RG_API_GOV seja nulo, comparar Nome_Mãe + Data_Nascimento.
Cálculo de Levenshtein Distance (similaridade de texto) para aceitar variações ortográficas mínimas.
Módulo C: Analisador de Experiência (CBO Matcher)
O core da "Certificação por Competência".
Tarefa: Consumir o array de "Vínculos Empregatícios" da API Gov.
Lógica de Negócio: * O admin cadastra uma lista de CBOs permitidos para cada curso técnico.
O sistema soma o tempo de serviço nos CBOs encontrados.
Output: Status "Apto" (se tempo > X meses) ou "Revisão Humana".
Módulo D: Financeiro e Recuperação de Vendas
Integração: Gateway de pagamento (Asaas/Stripe) via Webhook.
Recuperação Ativa: Se o Pix/Boleto não for pago, o sistema instrui a "Ana" a enviar uma oferta de desconto ou lembrete de expiração automaticamente.
Módulo E: Gerador de Dossiê de Auditoria
Output: Geração de PDF assinado digitalmente.
Conteúdo: Logs das consultas, prints da API Gov, fotos do OCR e histórico de interação. Este documento é a prova jurídica da escola.
3. REQUISITOS NÃO funcionais (segurança)
lgpd: criptografia de dados sensíveis (rgs e cpfs) em repouso (aes-256).
Logs de Auditoria: Cada ação do sistema (consulta, aprovação, erro) deve ser registrada com Timestamp e ID do usuário para fins de fiscalização.
Escalabilidade: O processamento de ocr e chamadas de api deve ser assíncrono (usando filas como redis/bullmq) para não travar o bot de whatsapp.
4. entregáveis (roadmap)
sprint 1: integração whatsapp + coleta de cpf + consulta api gov básica.
Sprint 2: Implementação do OCR + Lógica de Comparação em Cascata.
Sprint 3: Motor de análise de CBO (Experiência) + Geração de Dossiê PDF.
Sprint 4: Módulo Financeiro + Réguas de Recuperação de Vendas.
O sucesso deste SaaS depende da taxa de automação. O sistema deve ser desenhado para que o "humano" só precise intervir em casos de divergência grave de dados. O fluxo deve ser "hands-off" (mãos livres) desde o "Oi" no WhatsApp até a emissão do certificado. OBS: Já tenho a Api do gov para fazer a auditoria
Delivery term: Not specified