Sobre este projeto
it-programming / artificial-intelligence-1
Aberto
Estamos buscando um desenvolvedor backend altamente qualificado e especializado em Inteligência Artificial e Google Cloud para configurar e otimizar nossa própria infraestrutura de IA, utilizando Stable Diffusion xl (sdxl). O objetivo principal é reduzir os custos por imagem e eliminar a dependência de APIs externas caras, com um volume atual de aproximadamente 10.000 imagens por semana. O projeto envolve as seguintes etapas e requisitos:
1) Configuração do Stable Diffusion xl (sdxl) no google cloud:
- criar a infraestrutura necessária no google cloud, preferencialmente utilizando cloud run gpu ou uma vm g2-standard-4 com gpu l4.
- Instalar e configurar ComfyUI ou Diffusers para atuar como servidor da IA.
- Configurar o ambiente com CUDA, drivers e todas as dependências necessárias.
- Otimizar o sistema para gerar imagens em 1024x1024 com alta eficiência.
2) Desenvolvimento de uma API Simples para o Aplicativo Bubble:
- Criar um endpoint '/generate' para receber prompts e/ou imagens para processamento.
- Desenvolver um endpoint '/status' para consultar o andamento dos jobs de geração de imagem.
- A api deve retornar dados em formato json, incluindo o link da imagem final armazenada no cloud storage.
3) Implementação de Fila de Processamento:
- Cada requisição de geração de imagem deve ser tratada como um "job".
- A GPU deve processar os jobs sequencialmente ou em lote, conforme a otimização possível.
- Garantir que todas as requisições, independentemente do volume (5, 10 ou 20 imagens), sejam enfileiradas e processadas corretamente.
4) Armazenamento de Imagens no Cloud Storage:
- As imagens geradas devem ser salvas diretamente no Google Cloud Storage.
- Gerar URLs assinadas para acesso seguro às imagens.
- Retornar automaticamente essas URLs para o aplicativo Bubble.
5) Configuração de Automação para Redução de Custos:
- Implementar auto-scaling para ajustar os recursos conforme a demanda.
- Configurar auto-desligamento da infraestrutura quando não estiver em uso para minimizar custos.
- Priorizar o uso de Cloud Run GPU, que oferece cobrança por segundo e escala a zero.
6) Entrega de Documentação Simples:
- Fornecer documentação clara sobre como chamar a API.
- Instruções para reiniciar o servidor.
- Orientações para monitorar o uso e desempenho do sistema.
Requisitos do Profissional:
- Experiência comprovada com Google Cloud, especialmente com GPUs.
- Conhecimento em Docker e práticas de DevOps.
- Proficiência em Python (preferencialmente com FastAPI ou Flask).
- Familiaridade com modelos de ia open-source como sdxl, flux e sd3.
- Noções sólidas de otimização de GPU e gerenciamento de filas de jobs.
- Experiência em integração via api rest, idealmente com plataformas como bubble.
Categoria TI e Programação
Subcategoria Inteligência Artificial
Tamanho do projeto Médio
Prazo de Entrega: Não estabelecido
Habilidades necessárias