Estamos buscando um Engenheiro DevOps experiente para expandir nosso sistema de Gestão de Qualidade empresarial, atualmente desenvolvido em
Next.js e rodando em um servidor interno, para uma plataforma multi-tenant na AWS. O objetivo é disponibilizar o sistema para outras empresas, implementando controle de acesso baseado em função (RBAC) e utilizando autenticação Clerk.
O profissional será responsável por:
Arquitetura AWS de Produção:
- Definir e implementar a arquitetura alvo, incluindo a seleção de serviços AWS, design de rede, estratégias de segurança, escalabilidade e otimização de custos.
- Propor um desenho detalhado que contemple vpc, sub-redes, balanceamento de carga, recursos de compute (como ecs fargate), banco de dados gerenciado, armazenamento, dns e certificados tls.
Provisionamento da Infraestrutura:
- Criar toda a infraestrutura como código, preferencialmente utilizando Terraform.
- Garantir a separação de ambientes, com um mínimo de staging e produção.
Containerização e Runtime:
- Publicar a aplicação em um serviço aws adequado, como ecs fargate, ou propor uma alternativa tecnicamente justificada.
- Configurar health checks, autoscaling e uma estratégia de rollout/rollback que garanta zero downtime relevante.
Banco de Dados:
- Provisionar um banco de dados PostgreSQL gerenciado (RDS ou Aurora PostgreSQL).
- Implementar e executar migrações de banco de dados utilizando Prisma com segurança, e definir uma política robusta de backup e restore, com testes comprovados.
Segurança:
- Implementar o princípio de privilégio mínimo (IAM least privilege), configurar Security Groups, utilizar WAF (quando aplicável) e gerenciar segredos com Secrets Manager ou SSM Parameter Store.
- Garantir criptografia em trânsito e em repouso, hardening de headers e proteção da superfície pública da aplicação.
Observabilidade e Operação:
- Configurar logs centralizados, métricas, dashboards e alertas para monitoramento contínuo.
- Estabelecer uma trilha de auditoria operacional.
- Definir runbooks de incidente e procedimentos claros de troubleshooting.
ci/cd:
- ajustar o pipeline de ci/cd existente (atualmente em github actions) para incluir etapas de build, push de imagem para o repositório e deploy automatizado na aws.
- Separar os fluxos de deploy para staging e produção, com gates de aprovação obrigatórios para o ambiente de produção.
Documentação e Transferência de Conhecimento:
- Entregar documentação técnica completa e detalhada de todo o ambiente AWS implementado.
- Realizar um handover completo com a equipe interna, cobrindo aspectos de arquitetura, operação diária, procedimentos de rollback, restore e gestão de custos.
Prazo de Entrega: Não estabelecido