Sobre este projeto
it-programming / web-development
Aberto
O Que Buscamos: Estamos montando uma operação de originação de ativos judiciais (Precatórios) em escala. Já possuímos o minerador que coleta os textos brutos (recortes) dos Diários Oficiais. Precisamos de um Engenheiro de Dados/Backend Python para criar a camada de inteligência que lê, interpreta e estrutura esses dados.
O Desafio Técnico: Você deverá criar um script/microsserviço que:
Consuma os textos brutos do nosso Banco de Dados.
Aplique um pré-filtro (Regex/Keywords) para descartar lixo óbvio e economizar API.
Envie os textos relevantes para a API da OpenAI (GPT-4o mini).
Utilize Structured Outputs (JSON Mode) para garantir que a IA devolva os dados padronizados.
Salve o retorno qualificado (Valor, Credor, CPF, Tipo de Ação, Risco) de volta no Banco de Dados SQL.
O que NÃO precisamos:
Não precisa criar crawler (já temos os dados).
Não precisa criar frontend (painel bonito). O foco é Backend e Dados.
Requisitos Obrigatórios (Não envie proposta se não tiver):
Domínio avançado de Python e manipulação de JSON.
Experiência comprovada com a API da OpenAI (especificamente endpoints de ChatCompletion e Function Calling).
Conhecimento em Otimização de Custos de API (saber lidar com grandes volumes sem queimar orçamento).
Banco de Dados SQL.
Diferencial:
Conhecimento em filas (RabbitMQ/Redis) para processamento em lote (Batch).
Para sua proposta ser lida: Responda à seguinte pergunta na primeira linha da sua proposta: "Qual estratégia técnica você usaria para processar 50.000 linhas por dia sem estourar o limite de requisições da API ou travar o banco?"
Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Criar um novo site personalizado
Prazo de Entrega: Não estabelecido
Habilidades necessárias