Sobre este proyecto
it-programming / data-science-1
Abierto
Busco profissional para desenvolver um sistema automatizado com as seguintes funcionalidades:
Captura automatizada de publicações do Diário de Justiça Eletrônico do Estado de São Paulo, filtrando por termos específicos.
Extração estruturada de dados (número do processo, partes, data, etc.) E inserção em Google Sheets de forma automática.
Download automático dos processos no site do tjsp (e-saj).
Processamento e leitura dos PDFs usando inteligência artificial, para:
Extrair dados sensíveis.
Analisar conteúdo jurídico e informações-chave.
Geração automática de relatórios formatados (docx/pdf) e envio por e-mail/google drive.
Integração completa e orquestração para que o fluxo seja 100% automatizado.
Requisitos técnicos desejáveis
Experiência com web scraping e automação de captura de dados (Selenium, Playwright ou equivalente).
Conhecimento em OCR e extração de texto de PDFs (Tesseract, Amazon Textract ou similar).
Experiência com APIs de Google Sheets, Google Docs e integração com Google Drive.
Domínio em integração de IA (OpenAI GPT, Claude, ou frameworks como LangChain/LlamaIndex).
Capacidade de integrar todo o fluxo via Make, n8n, Zapier ou Airflow.
Experiência com processos judiciais brasileiros será um diferencial.
Entregáveis esperados:
Sistema totalmente automatizado, com execução programada.
Código-fonte documentado.
Fluxo de trabalho funcional do início ao fim.
Tutorial básico de uso para operação diária.
Tipo de contratação:
Projeto pontual com possibilidade de manutenção contínua.
Pagamento a combinar conforme complexidade e prazo de entrega.
Contexto general del proyecto
Automatizar processos internos da empresa, atualmente feito de forma manual.
Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Medio
¿Es un proyecto o una posición? Un proyecto
Disponibilidad requerida Según se necesite
Plazo de Entrega: No definido