About this project
it-programming / data-science-1
Open
Se busca un ingeniero o ingeniera de datos con experiencia para un proyecto específico centrado en la gestión y procesamiento de metadatos. El objetivo principal es desarrollar un pipeline robusto y automatizado para la carga, limpieza y comparación de datos.
Las tareas clave incluyen:
- Automatizar completamente los procesos de carga y limpieza de archivos en formatos CSV y Excel.
- Implementar mecanismos eficientes para detectar y prevenir la duplicación de registros al comparar los nuevos datos con bases de datos existentes.
- Entregar un conjunto de scripts bien estructurados, reutilizables y con la documentación necesaria para su fácil comprensión y mantenimiento.
- Configurar un pipeline de datos que sea sencillo de ejecutar y gestionar de forma autónoma.
Requisitos indispensables para el perfil:
- Dominio avanzado de Python, con especial énfasis en el uso de la librería Pandas para manipulación de datos.
- Experiencia sólida en la gestión y consulta de bases de datos PostgreSQL.
- Capacidad demostrada para trabajar con grandes volúmenes de datos, asegurando la eficiencia y la integridad de los mismos.
Este es un proyecto autónomo que requiere un profesional capaz de trabajar de forma independiente, sin necesidad de acompañamiento constante.
Category IT & Programming
Subcategory Data Science
Project size Large
Delivery term: Not specified
Skills needed