Completed

Datawarehouse

Published on the June 14, 2020 in IT & Programming

About this project

Open

Olá!
Preciso de um frelance em R ou Python para o seguinte problema:

1. Importar os dados de aproximadamente 20 planilhas Excel de 100 megabytes cada, com apximadamente 300 mil linhas e 35 colunas, para o RSTudio usando uma função fread ou similar do R ou Python.

2. Fazer a Arrumação/Limpeza/Transformação dos dados já no carregamento, fazendo a tipagem das variáveis de data, números inteiros e decimais e POSIXcT (duração hora/minuto);

3. Após a limpeza e transformação, os dados das várias planilhas devem ser convertidos (merge/appendi) num único dataframe e depois exportados/gravados numa tabela para um banco Postgre ou AWS (preferência), MySQL, SQL Server ou SQLite;

4. Após a gravação, os dados precisam ser acessados no browser (Metabase? ou similar?) permitindo a manipulação, análise e visualização.

O projeto será considerado finalizado quando ao banco criado for possível acrescentar novas planilhas de preríodos deiferentes.

Project overview

O objetivo do projeto é montar uma base dados para depois fazer o processo de Bi.

Category IT & Programming
Subcategory Web development
What is the scope of the project? Medium-sized change
Is this a project or a position? Project
I currently have I have specifications
Required availability As needed
Roles needed Developer

Delivery term: Not specified

Skills needed

Other projects posted by A.