Sobre este projeto
it-programming / data-science-1
Aberto
Buscamos un experto en Ingeniería de Datos y Business Intelligence para diseñar y automatizar un ecosistema de reporte que integre múltiples fuentes de datos. El objetivo principal es centralizar la información de ventas históricas, ventas actuales y reportes externos de distribuidores en una plataforma web de fácil consulta.
Es indispensable que sepa hablar/conversar en español.
Alcance del Trabajo:
Integración de Datos (etl/elt):
conexión y extracción incremental de sap hana (instancia privada en la nube).
Migración de datos históricos desde SQL Server (Data que no cambiara)
Procesamiento de archivos Excel externos: Implementar una solución para tabular y normalizar reportes de ventas externas. Existen al menos 6 formatos distintos de ventas externas.
Mapeo de Datos: Crear una lógica de homologación (Mapping) para vincular códigos y descripciones de productos de terceros con los maestros de sap hana (unificación de criterios por ciudad, producto , cliente, etc).
Arquitectura de Datos:
Configuración de un Data Warehouse ligero y rápido (preferiblemente basado en DuckDB, PostgreSQL o similar).
Uso de herramientas de transformación (pueden ser scripts de Python, SQL o herramientas de Azure como Logic Apps/Data Factory) para automatizar el flujo.
Visualización y Reporting (Web):
Implementación de una herramienta BI accesible vía web que sea intuitiva para el usuario final (Ej: Metabase, Apache Superset, o similar). Nota: No se aceptarán propuestas basadas en Power BI.
Creación de Dashboards específicos: Ventas por ciudad, Top de clientes, y Cálculo de Comisiones con filtros de fecha y zona geográfica. ( Al menos 15 reportes especificos)
Requisitos del Candidato:
Experiencia demostrable en proyectos de Data Warehousing e integración de fuentes híbridas.
Dominio avanzado de SQL y lenguajes de transformación (Python/Pandas es un plus).
Experiencia conectando entornos de sap hana.
Capacidad para proponer y configurar la plataforma de BI (Metabase, Superset, etc.) En un servidor de nube (Azure/Compute).
Habilidad para crear procesos de limpieza de datos (Data Cleansing) para los reportes de Excel .
Idioma: Español fluido.
Entregables:
Pipeline de datos automatizado (especialmente para la data de SAP y Excel).
Base de datos centralizada y optimizada.
Dashboards web configurados con roles de usuario y filtros dinámicos.
Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Médio
Prazo de Entrega: Não estabelecido
Habilidades necessárias