Evaluando propuestas

Extração de dados e filtragem de Cnaes na base Cnpj Pública (Receita Federal – 2025)

Publicado el 07 Septiembre, 2025 en Programación y Tecnología

Sobre este proyecto

Abierto

Procuramos um profissional de dados para baixar e processar a base pública do CNPJ disponibilizada pela Receita Federal, na versão de maio/2025, cujo acesso está em https://arquivos.receitafederal.gov.br/dados/cnpj/dados_abertos_cnpj/2025-05/
. O trabalho consiste em:

Fazer o download de todos os arquivos (.zip) da base CNPJ 2025‑05, descompactá‑los e organizar os dados para análise.

Carregar e integrar as tabelas de “Empresas”, “Estabelecimentos”, “CNAE” e “Municípios” para compor uma base única de empresas brasileiras.

Filtrar os registros de acordo com uma lista pré-definida de CNAEs de interesse (9602-5/02, 8630-5/01, 8630-5/03, 8630-5/04, 8630-5/02, 8630-5/99 e 8650-0/99), considerando tanto CNAE principal quanto secundário.

Manter apenas os estabelecimentos em situação cadastral ativa e remover duplicidades.

Entregar a base completa (sem filtros) em um único arquivo (.csv ou .parquet) e, separadamente, uma base filtrada em formato Excel, com uma planilha por estado (uf) contendo cnpj completo, razão social, nome fantasia, cnae e demais campos de interesse.

O trabalho requer experiência com grandes volumes de dados e ferramentas como Python/pandas. Esperamos comunicação transparente (envio de atualizações periódicas) e cumprimento de prazos.

Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Medio
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo No aplica
Disponibilidad requerida Según se necesite
Roles necesarios Programador

Plazo de Entrega: 10 Septiembre, 2025

Habilidades necesarias

Otros proyectos publicados por F.