Analisando propostas

Desenvolvedor Backend + Ia + Google Cloud para Implementação de Stable Diffusion Xl e Api p Bubble

Publicado em 09 de Novembro de 2025 dias na TI e Programação

Sobre este projeto

Aberto

Estamos buscando um desenvolvedor backend altamente qualificado e especializado em Inteligência Artificial e Google Cloud para configurar e otimizar nossa própria infraestrutura de IA, utilizando Stable Diffusion xl (sdxl). O objetivo principal é reduzir os custos por imagem e eliminar a dependência de APIs externas caras, com um volume atual de aproximadamente 10.000 imagens por semana. O projeto envolve as seguintes etapas e requisitos:

1) Configuração do Stable Diffusion xl (sdxl) no google cloud:
  - criar a infraestrutura necessária no google cloud, preferencialmente utilizando cloud run gpu ou uma vm g2-standard-4 com gpu l4.
  - Instalar e configurar ComfyUI ou Diffusers para atuar como servidor da IA.
  - Configurar o ambiente com CUDA, drivers e todas as dependências necessárias.
  - Otimizar o sistema para gerar imagens em 1024x1024 com alta eficiência.

2) Desenvolvimento de uma API Simples para o Aplicativo Bubble:
  - Criar um endpoint '/generate' para receber prompts e/ou imagens para processamento.
  - Desenvolver um endpoint '/status' para consultar o andamento dos jobs de geração de imagem.
  - A api deve retornar dados em formato json, incluindo o link da imagem final armazenada no cloud storage.

3) Implementação de Fila de Processamento:
  - Cada requisição de geração de imagem deve ser tratada como um "job".
  - A GPU deve processar os jobs sequencialmente ou em lote, conforme a otimização possível.
  - Garantir que todas as requisições, independentemente do volume (5, 10 ou 20 imagens), sejam enfileiradas e processadas corretamente.

4) Armazenamento de Imagens no Cloud Storage:
  - As imagens geradas devem ser salvas diretamente no Google Cloud Storage.
  - Gerar URLs assinadas para acesso seguro às imagens.
  - Retornar automaticamente essas URLs para o aplicativo Bubble.

5) Configuração de Automação para Redução de Custos:
  - Implementar auto-scaling para ajustar os recursos conforme a demanda.
  - Configurar auto-desligamento da infraestrutura quando não estiver em uso para minimizar custos.
  - Priorizar o uso de Cloud Run GPU, que oferece cobrança por segundo e escala a zero.

6) Entrega de Documentação Simples:
  - Fornecer documentação clara sobre como chamar a API.
  - Instruções para reiniciar o servidor.
  - Orientações para monitorar o uso e desempenho do sistema.

Requisitos do Profissional:
- Experiência comprovada com Google Cloud, especialmente com GPUs.
- Conhecimento em Docker e práticas de DevOps.
- Proficiência em Python (preferencialmente com FastAPI ou Flask).
- Familiaridade com modelos de ia open-source como sdxl, flux e sd3.
- Noções sólidas de otimização de GPU e gerenciamento de filas de jobs.
- Experiência em integração via api rest, idealmente com plataformas como bubble.

Categoria TI e Programação
Subcategoria Inteligência Artificial
Tamanho do projeto Médio

Prazo de Entrega: Não estabelecido

Habilidades necessárias