Sobre este projeto
it-programming / data-science-1
Aberto
Estamos buscando um especialista em Google BigQuery e Google Cloud Platform para desenvolver e implementar uma solução completa de organização, automação e análise de dados de saúde. O projeto envolve a criação de rotinas robustas para gerenciamento de dados, desde o backup até a visualização e extração.
As principais tarefas incluem:
Montar uma rotina automática de backup das bases de dados existentes no Google Drive para o Google Cloud Storage, garantindo a segurança e acessibilidade dos dados.
Desenvolver e implementar uma rotina automática de ingestão de dados do Google Cloud Storage para datasets no BigQuery. Esta rotina deve manter o histórico dos dados e preservar a estrutura existente, assegurando a integridade e rastreabilidade.
Configurar processos automáticos de data profiling e data quality dentro do BigQuery para garantir a consistência, precisão e completude dos dados.
Configurar um dashboard de avaliação e monitoramento dos dados no BigQuery, utilizando o Looker Studio, para fornecer insights claros e acompanhamento em tempo real.
Criar um processo eficiente de extração de dados do BigQuery, com a capacidade de gerar arquivos em formatos como CSV e Excel para entrega e compartilhamento.
Fornecer uma explicação didática e documentação detalhada para que o nosso time interno possa replicar, manter e expandir o processo de forma autônoma no futuro.
Diferenciais desejados para o candidato:
Experiência prática comprovada com Google BigQuery e Google Cloud Platform.
Conhecimento sólido e experiência avançada em SQL para manipulação e consulta de grandes volumes de dados.
Experiência prévia com bases de dados de grande porte.
Um diferencial significativo será a experiência com dados de saúde, compreendendo as particularidades e requisitos desse tipo de informação.
Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Grande
Duração do projeto Não estabelecido
Habilidades necessárias