Evaluando propuestas

Extração de dados com python. Preciso extrair o nome de empresas com espaço correto a partir do site da empresa.

Publicado el 17 Febrero, 2023 en Programación y Tecnología

Sobre este proyecto

Abierto

Olá, preciso obter nomes de empresas de sites com espaço adequado. Por exemplo: O nome real da empresa imperiodasmilhas.com é "imperio das milhas".

Eu consigo essa informação do meta título do site: title Império das Milhas - Tudo sobre milhas bem aqui! title Mas eu preciso remover todas as outras palavras, e no final ter apenas: Imperio das milhas

Eu acho que o método mais rápido para isso provavelmente está usando Regex, para detectar as 3 primeiras letras do domínio e as 3 últimas letras, e usar isso para excluir tudo depois e excluir tudo antes. Abaixo está uma planilha explicando como resolver isso de maneiras diferentes e com dados de amostra:
https://docs.google.com/spreadsheets/d/1ZMDfZTeAmshHMWAX5j9cfzy_vw5QiRjx1EXBzSNhD48/edit#gid=489305207

Também preciso que isso seja feito em python, eu preciso do código-fonte e também preciso que você me entregue um arquivo executável para que eu possa usá-lo para fornecer uma lista de URLs e a saída seja um arquivo txt ou csv com os nomes das empresas.  Inclua o codigo 1020 na sua proposta para provar que você leu minha descrição.

Categoría Programación y Tecnología
Subcategoría Otros
Tamaño del proyecto Medio
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo las especificaciones
Disponibilidad requerida Según se necesite
Roles necesarios Programador

Plazo de Entrega: 18 Febrero, 2023

Habilidades necesarias

Otros proyectos publicados por R. P.