Sobre este projeto
it-programming / data-science-1
Aberto
Contexto Geral do Projeto
Ejercicio: 1) Me proporcionan 4 data set en CSV. 2) Me dan una VPN en Openvpn y con el que puedo hacer un cluster, para luego acceder al postgresql. 3) Me piden descargar Pentaho y JDK8. 4) Cargar los 4 archivos utilizando procesos PDI (Pentaho Data Integration), dentro de un esquema “stage” que previamente debes crear. Dicho proceso debe contar con las validaciones necesarias para la carga de los archivos en cuestión. 5) Crear un esquema “prod”, en el cual debes armar un modelo relacional, preferentemente dimensional estrella, en base a la fuente de datos mencionada anteriormente proveniente del esquema “stage”, poblando las tablas de este nuevo modelo que crees, con los tipos de datos adecuados. 6) Generar un DER con el modelo creado en el ítem anterior. 7) Crear un tablero en PowerBI de forma libre con algunos indicadores claves, que apunte a un nivel gerencial/directivo, con la cantidad de páginas que consideren, y los FILTROS necesarios, en base a los siguientes niveles. 8) Finalmente deberás entregar por mail los siguientes ítems: Los Jobs y las transformaciones que utilices para realizar la carga de los archivos. El der que explicite la implementación en la bd postgresql. El archivo PBIX que contiene el tablero generado.
Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Pequeño
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário
Prazo de Entrega: Não estabelecido
Habilidades necessárias