Sobre este projeto
it-programming / data-science-1
Aberto
Estou buscando um desenvolvedor Python experiente para aprimorar um robô de coleta de dados existente e integrar uma camada avançada de inteligência artificial. O projeto faz parte de um Trabalho de Conclusão de Curso (TCC) e já possui um código base funcional.
Contexto do Projeto:
Atualmente, temjo um script em Python que coleta avaliações de restaurantes no TripAdvisor. Ele extrai informações básicas como nome do restaurante, nota e o texto da review, e possui uma interface gráfica simples desenvolvida com CustomTkinter.
Resumo:
Ajustar campos, trocar API (OpenAI p/ Gemini) e configurar o prompt -
O código já lida com os cabeçalhos (headers) e a estrutura do TripAdvisor. Você só precisa mapear dois ou três campos novos que identifiquei;
O projeto é uma manutenção e melhoria de um código existente. A estrutura de interface e coleta principal já está pronta, o foco é a integração da API e o refinamento dos dados;
Vou te entregar o arquivo .py atual e o arquivo .env de exemplo. O código está comentado e a lógica de salvar no Excel está funcionando 100%.
Escopo do Trabalho detalhado:
Passo 1: Ajustes e Melhorias no Coletor de Dados (Python)
Correção e Adição de Campos: Implementar a coleta do campo "Nível de Contribuidor" (Level) das avaliações. Garantir que o "Título da Review" e o "Corpo da Review" sejam salvos de forma concatenada ou em uma única célula/coluna no arquivo de saída.
Organização do Output: Assegurar que o arquivo Excel final seja gerado com colunas devidamente organizadas e auto-ajustadas para facilitar a visualização e análise dos dados.
Passo 2: Implementação de Inteligência de Dados com Gemini 1.5 Pro
Migração de API: Substituir a integração atual com a API da OpenAI pela API do Google AI Studio (Gemini 1.5 Pro).
Prompt Estruturado e Análise de Sentimento: Configurar a IA para analisar o texto de cada review com base na Appraisal Theory (Teoria da Avaliatividade). A IA deverá classificar cada avaliação nos seguintes atributos:
Categoria Atitude: (Afeto, Julgamento ou Apreciação).
Polaridade: (Positivo ou Negativo).
Intensidade: (Escala de 1 a 3).
Alvo (Target): (Produto, Serviço ou Ambiente).
Output da IA: Os resultados da classificação da IA devem ser salvos em colunas específicas e dedicadas no arquivo Excel final, ao lado dos dados brutos da review.
Material de Apoio:
Sobre a Appraisal Theory para auxiliar na compreensão e implementação da lógica de classificação da IA, se preciso com exemplos.
Requisitos Técnicos:
Domínio de Python e suas bibliotecas para web scraping (BeautifulSoup/Playwright/Selenium) e manipulação de dados (Pandas).
Experiência com API do Google AI Studio (Gemini)
Prompt Engineering para estruturar prompts eficazes e extrair dados em formatos JSON ou outros formatos estruturados.
Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Pequeño
Prazo de Entrega: Não estabelecido
Habilidades necessárias