Estamos buscando um freelancer para desenvolver um projeto acadêmico completo focado na criação de um pipeline de dados para dispositivos IoT. O projeto utilizará um dataset público do Kaggle contendo leituras de temperatura de sensores. O objetivo principal é construir uma solução robusta que abranja desde a ingestão e processamento dos dados até a visualização interativa.
As etapas e requisitos do projeto incluem:
1. Leitura e Processamento de Dados: Desenvolver scripts em Python para ler os dados de um arquivo CSV. As informações deverão ser processadas e transformadas utilizando a biblioteca Pandas.
2. Armazenamento de Dados: Os dados processados deverão ser armazenados em um banco de dados PostgreSQL. O banco de dados deve ser configurado para rodar em um ambiente Docker.
3. Análise de Dados com SQL: Após o armazenamento, será necessário criar um mínimo de 3 views SQL para facilitar a análise das informações. Exemplos de views incluem: média de temperatura por dispositivo, quantidade de leituras por hora e temperaturas máximas e mínimas por dia.
4. Dashboard Interativo: Desenvolver um dashboard interativo utilizando as bibliotecas Streamlit e Plotly em Python. Este dashboard deve permitir a visualização dos dados através de gráficos claros e informativos.
5. Organização e Publicação: O projeto completo deve ser organizado e publicado em um repositório público no GitHub. O repositório deve incluir:
* Todos os scripts em Python para processamento de dados e criação do dashboard.
* Instruções detalhadas de execução no arquivo
README.md.
* Uma organização básica de pastas que facilite a compreensão e manutenção do código.
* O dataset utilizado ou um link direto para download via Kaggle.
O código entregue deve ser funcional, bem documentado e permitir a execução completa do pipeline de dados e do dashboard. O prazo de entrega para este projeto é até 23/03.
Prazo de Entrega: Não estabelecido