Sobre este projeto
it-programming / web-development
Aberto
Estamos buscando um desenvolvedor experiente para criar robôs de raspagem de dados (web scrapers) para coletar informações de imóveis nos portais olx, zap imóveis e viva real. O objetivo é extrair dados relevantes de anúncios de imóveis localizados nas seguintes cidades do Rio de Janeiro: Duque de Caxias, Belford Roxo, Nova Iguaçu, Mesquita, Nilópolis e São João de Meriti.
Os robôs devem ser robustos, eficientes e capazes de lidar com as estruturas específicas de cada site. A solução deve ser entregue como um conjunto de scripts ou uma aplicação que possa ser executada para coletar os dados de forma contínua ou sob demanda. O projeto atual tem um domínio hospedado no GitHub, e a integração ou compatibilidade com esse ambiente será um diferencial.
Esperamos que os dados extraídos incluam, mas não se limitem a: tipo de imóvel, preço, número de quartos, banheiros, área, endereço (se disponível), descrição, fotos e links para os anúncios originais. O formato de saída dos dados deve ser flexível, preferencialmente csv ou json, para facilitar a importação e análise.
Buscamos um profissional com conhecimento em técnicas de web scraping, tratamento de dados e que possa oferecer uma solução escalável e de fácil manutenção.
Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Alteração média
Prazo de Entrega: Não estabelecido
Habilidades necessárias