Estamos buscando um especialista para realizar a implantação da versão mais simples do NVIDIA Tokkio (llm-rag) na amazon web services (aws). O objetivo é ter o sistema totalmente funcional e acessível via navegador, utilizando exclusivamente os scripts oficiais fornecidos pela NVIDIA. Além da implantação, o projeto inclui uma aula prática durante a execução, com explicação dos passos realizados, visando capacitação para futuras implantações.
Escopo do projeto: Criação e configuração de uma instância EC2 com GPU (ex:
g4dn.xlarge ou similar), compatível com os requisitos do NVIDIA Tokkio. Configuração completa do ambiente AWS e do sistema operacional Ubuntu 22.04, incluindo todas as dependências necessárias. Validação da GPU instalada, utilizando ferramentas como nvidia-smi, garantindo o correto reconhecimento e funcionamento. Execução dos scripts oficiais do NVIDIA Tokkio para implantação do fluxo llm-rag. Configuração dos arquivos .env e
config.yml, adaptados ao ambiente AWS. Entrega das URLs de acesso para a Interface Web (UI) do Tokkio, API do Tokkio e ACE Configurator. Requisitos do profissional: Experiência comprovada com AWS, Linux (Ubuntu 22.04), Docker e scripts Bash. Experiência com gpu nvidia / cuda para workloads de ia.
Diferencial: Experiência prévia com nvidia ace, tokkio, llms ou rag.
Aula prática / mentoria técnica: Implantação acompanhada em tempo real, via compartilhamento de tela. Explicação dos passos.
Duração do projeto Não estabelecido