Evaluating bids

Extração de dados com python. Preciso extrair o nome de empresas com espaço correto a partir do site da empresa.

Published on the February 17, 2023 in IT & Programming

About this project

Open

Olá, preciso obter nomes de empresas de sites com espaço adequado. Por exemplo: O nome real da empresa imperiodasmilhas.com é "imperio das milhas".

Eu consigo essa informação do meta título do site: title Império das Milhas - Tudo sobre milhas bem aqui! title Mas eu preciso remover todas as outras palavras, e no final ter apenas: Imperio das milhas

Eu acho que o método mais rápido para isso provavelmente está usando Regex, para detectar as 3 primeiras letras do domínio e as 3 últimas letras, e usar isso para excluir tudo depois e excluir tudo antes. Abaixo está uma planilha explicando como resolver isso de maneiras diferentes e com dados de amostra:
https://docs.google.com/spreadsheets/d/1ZMDfZTeAmshHMWAX5j9cfzy_vw5QiRjx1EXBzSNhD48/edit#gid=489305207

Também preciso que isso seja feito em python, eu preciso do código-fonte e também preciso que você me entregue um arquivo executável para que eu possa usá-lo para fornecer uma lista de URLs e a saída seja um arquivo txt ou csv com os nomes das empresas.  Inclua o codigo 1020 na sua proposta para provar que você leu minha descrição.

Category IT & Programming
Subcategory Other
Project size Medium
Is this a project or a position? Project
I currently have I have specifications
Required availability As needed
Roles needed Developer

Delivery term: February 18, 2023

Skills needed

Other projects posted by R. P.