Necessitamos de um especialista em extração de dados (Web Scraping) para coletar informações detalhadas de imóveis em portais específicos, com o objetivo de alimentar uma base de dados para prospecção e análise de mercado. O projeto envolve a criação de um sistema robusto e automatizado para extrair dados de diversos sites imobiliários.
Sites Alvo:
- Fenyz: Extração de anúncios, incluindo título, valor, metragem, condomínio, descrição, fotos e links diretos.
- Eemovel: Coleta de dados de mercado e comparativos de imóveis.
- Grandes Portais Imobiliários (como Zap Imóveis e VivaReal): Extração de dados por filtros geográficos específicos.
Requisitos Técnicos do Sistema:
- Input por URL: O script ou automação desenvolvida deve permitir a inserção de uma lista de URLs de busca, a partir das quais todos os imóveis listados serão extraídos.
- Saída Estruturada: Os dados coletados devem ser entregues de forma estruturada, preferencialmente em uma Google Sheets ou arquivo CSV formatado.
- Campos Obrigatórios: A extração deve incluir, no mínimo, os seguintes campos: Valor de venda, Valor de condomínio, IPTU, metragem total/útil, número de suítes/vagas, Endereço/Condomínio, Link direto do anúncio e Data da extração.
- Contorno de Bloqueios: É fundamental que o sistema utilize técnicas avançadas para evitar bloqueios por parte dos portais, como o uso de Proxies, User-Agents rotativos ou a integração com ferramentas especializadas como ScrapingBee ou Apify, dado que esses portais possuem proteções anti-bot.
- Automação: Buscamos uma solução que possa ser agendada para rodar semanalmente, preferencialmente desenvolvida em Python,
Node.js ou com integração via
Make.com.
Diferenciais para Seleção:
- Experiência comprovada em projetos de scraping no nicho imobiliário.
- Habilidade para contornar sistemas anti-bot complexos (como Cloudflare e Captchas).
- Capacidade de sugerir e implementar uma metodologia para identificar imóveis que tiveram redução de preço, através da comparação de extrações anteriores.
Prazo de Entrega: Não estabelecido