Trabajando

Desenvolvimento de Script Python para Data Mining de Playlists do Spotify e Extração de Letras

Publicado el 04 Diciembre, 2025 en Programación y Tecnología

Sobre este proyecto

Abierto

O projeto consiste no desenvolvimento de um script em Python para realizar data mining em playlists do Spotify. O objetivo principal é extrair informações detalhadas de aproximadamente 36.000 músicas de quatro playlists específicas (três com 10.000 músicas e uma com 3.333 músicas) e, subsequentemente, coletar as letras de cada uma dessas músicas.

As tarefas incluem:

1.  Acesso à API do Spotify: Utilizar a API do Spotify para obter os dados das playlists.
2.  Extração de Metadados: Para cada música, extrair o nome da música (track name), artista(s), álbum e data de lançamento.
3.  Geração de Tabela Excel: Compilar todos os metadados extraídos (nome da música, artista(s), álbum, data de lançamento) em uma tabela no formato Excel para fácil visualização e análise.
4.  Pesquisa e Extração de Letras: Para cada uma das 36.000 músicas, realizar uma pesquisa no Google para encontrar e extrair suas letras. É Crucial que o script seja robusto para lidar com variações de sites de letras e possíveis erros na busca.
5.  Geração de Arquivos de Texto Compactos: Criar 13 arquivos de texto separados, cada um contendo aproximadamente 2.800 músicas. Cada linha nesses arquivos deve seguir o formato: track_id|track_name|artists|album_name|release_date|lyrics. Os dados dentro de cada arquivo devem ser ordenados primeiramente por artista (em ordem alfabética) e depois pela data de lançamento do álbum. O volume total de texto esperado para as letras é de cerca de 8 milhões de palavras, com cada arquivo contendo aproximadamente 620.000 palavras.

Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Medio

Plazo de Entrega: No definido

Habilidades necesarias