Analisando propostas

Extração de dados e filtragem de Cnaes na base Cnpj Pública (Receita Federal – 2025)

Publicado em 07 de Setembro de 2025 dias na TI e Programação

Sobre este projeto

Aberto

Procuramos um profissional de dados para baixar e processar a base pública do CNPJ disponibilizada pela Receita Federal, na versão de maio/2025, cujo acesso está em https://arquivos.receitafederal.gov.br/dados/cnpj/dados_abertos_cnpj/2025-05/
. O trabalho consiste em:

Fazer o download de todos os arquivos (.zip) da base CNPJ 2025‑05, descompactá‑los e organizar os dados para análise.

Carregar e integrar as tabelas de “Empresas”, “Estabelecimentos”, “CNAE” e “Municípios” para compor uma base única de empresas brasileiras.

Filtrar os registros de acordo com uma lista pré-definida de CNAEs de interesse (9602-5/02, 8630-5/01, 8630-5/03, 8630-5/04, 8630-5/02, 8630-5/99 e 8650-0/99), considerando tanto CNAE principal quanto secundário.

Manter apenas os estabelecimentos em situação cadastral ativa e remover duplicidades.

Entregar a base completa (sem filtros) em um único arquivo (.csv ou .parquet) e, separadamente, uma base filtrada em formato Excel, com uma planilha por estado (uf) contendo cnpj completo, razão social, nome fantasia, cnae e demais campos de interesse.

O trabalho requer experiência com grandes volumes de dados e ferramentas como Python/pandas. Esperamos comunicação transparente (envio de atualizações periódicas) e cumprimento de prazos.

Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Médio
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Não se aplica
Disponibilidade requerida Conforme necessário
Funções necessárias Desenvolvedor

Prazo de Entrega: 10 de Setembro de 2025

Habilidades necessárias

Outro projetos publicados por F.