Sobre este proyecto
it-programming / data-science-1
Abierto
Descrição:
Estamos em busca de um profissional experiente em web scraping, análise de dados e mapeamento urbano para nos ajudar a levantar informações detalhadas sobre empreendimentos imobiliários de médio e alto padrão entregues na cidade de São Paulo entre os anos de 2020 e 2025.
Objetivo:
Criar uma base de dados com os principais empreendimentos lançados e/ou entregues em São Paulo neste período, com informações como nome, endereço, data de entrega, padrão construtivo, área e construtora responsável.
Fontes de Dados (sugestões iniciais):
Portais Imobiliários: Zap Imóveis, Viva Real, 123i, Loft, EmCasa
Sites de Construtoras: Cyrela, Lavvi, EZTec, Even, Tegra etc.
Fontes públicas complementares (se viável): Geosampa, crea-sp, cau-sp
informações desejadas para cada empreendimento:
nome do empreendimento
endereço completo (rua, número, bairro)
bairro e zona (norte, sul, leste, oeste, centro)
data de entrega (ou previsão)
nome da construtora ou incorporadora
padrão do imóvel (médio ou alto padrão – estimado por preço/m² e acabamento)
área construída ou metragem privativa
link da fonte (para conferência)
entregáveis:
planilha organizada (excel ou google sheets)
dados limpos, organizados e, quando possível, classificados por zona e ano
observações como “não identificado” são aceitas nos casos em que a informação não estiver disponível com confiabilidade
requisitos:
experiência comprovada em web scraping (python, beautifulsoup, selenium, etc.)
Capacidade de navegar e extrair dados estruturados de sites imobiliários
Habilidade com tratamento e organização de dados em Excel/CSV
Atenção aos detalhes e foco em dados relevantes para o mercado imobiliário
Diferenciais:
Conhecimento do mercado imobiliário de São Paulo
Experiência com Geosampa, qgis ou ferramentas gis
capacidade de enriquecer os dados com fontes complementares públicas
tipo de projeto:
projeto pontual com entrega única, mas com potencial de continuidade para novos levantamentos e cruzamentos de dados.
Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Grande
Plazo de Entrega: No definido
Habilidades necesarias