Estruturação de arquivo gigante


Completed
Description:
Eu preciso que carreguem todas as linhas disponíveis no arquivo da url em anexo, selecionamento somente as linhas do cnpj. Abaixo o link
https://receita.economia.gov.br/orientacao/tributaria/cadastros/cadastro-nacional-de-pessoas-juridicas-cnpj/dados-publicos-cnpj

A especificação do arquivo está na mesma página, logo a tarefa é:

Fazer download do arquivos DADOS_ABERTOS_CNPJ.zip
O layout do aquivo está em
http://200.152.38.155/CNPJ/LAYOUT_DADOS_ABERTOS_CNPJ.pdf

E com base neste layout, retirar somente as linhas para CNPJ. Não preciso das linhas referentes ao sócios (que devem estar no mesmo arquivo).
Para isso, vamos extrair somente as linhas que tem no campo TIPO DE REGISTRO = 1 para o LAYOUT PRINCIPAL (Dados Cadastrais)

Category: IT & Programming
Subcategory: Other
Project size: Small
Is this a project or a position?: Project
I currently have: Not applicable
Required availability: As needed

MySQL PHP Python SQL Big Data

Less than USD 50

Budget

8

Bids

10

Interested freelancers

Published: 3 months ago

Deadline: 5 days

Create your own project

Are you looking for a freelancer to work on a similar project? Create your own project and you’ll receive proposals from the best freelancers.


Freelancers who already applied to this project

Saymon J.Computer engineering student. Experienced in C++, C# and Java. Experienced in Windows and Linux. My aim is to provide high quality software to my clients. More details

Edilson S.Experiência de mais de 10 anos em desenvolvimento de soluções web. Desenvolvedor de web crawlers/scrapers, utilizando as linguagens PHP, Python/Scrapy/Selenium. Desenvolvimento de scrapers para sites de apostas, co... More details