Sobre este projeto
it-programming / data-science-1
Aberto
Estate Atlas es una startup de datos como servicio (DaaS) con la misión de proporcionar información basada en datos sobre los mercados inmobiliarios globales. Nuestro objetivo es empoderar a inversores, analistas y profesionales con datos inmobiliarios precisos, transparentes y prácticos, construyendo la principal fuente mundial de datos inmobiliarios internacionales.
Ya hemos diseñado una infraestructura ETL de vanguardia sin servidor y ahora buscamos un experto para impulsar esta infraestructura. El enfoque principal será localizar fuentes de datos internacionales de alto valor, verificar su precisión e integrar estos datos en nuestro ecosistema.
El profesional seleccionado será responsable de expandir nuestra cobertura a más de 15 países, asegurando que los datos sin procesar de diversas fuentes globales se extraigan, limpien y carguen correctamente en nuestro lago de datos.
Responsabilidades diarias incluirán:
Exploración y verificación de fuentes: Investigar y localizar activamente fuentes de datos fiables (registros gubernamentales, bancos centrales, portales). Crear hojas de datos detalladas para verificar la fiabilidad, el formato y la frecuencia de actualización de cada fuente.
Integración de pipelines: Escribir y mantener scripts Python eficientes para extraer datos sin procesar e integrarlos en nuestro pipeline ETL sin servidor existente.
Perfilado y calidad de datos: Analizar datos de muestra para comprender su estructura, incluyendo la comprobación de valores nulos, únicos y atípicos. Definir y aplicar las reglas de negocio necesarias para asegurar la calidad y limpieza de los datos.
Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Grande
Duração do projeto Não estabelecido
Habilidades necessárias