Estamos buscando um desenvolvedor freelancer experiente para criar uma plataforma web robusta que funcione como um agregador de notícias e um gerador de feeds rss/xml. O objetivo principal é permitir que os usuários insiram Urls de sites ou páginas de notícias, e o sistema automaticamente extraia e estruture o conteúdo para gerar feeds rss/xml válidos.
Funcionalidades Essenciais:
Cadastro de Fontes: O sistema deve permitir o cadastro de diversas URLs de sites/páginas de notícias como fontes.
Extração de Dados: Para cada notícia, a plataforma deve ser capaz de identificar e extrair os seguintes dados:
Título
Subtítulo/Chamada
Corpo do Texto
Imagem Principal (com créditos, se disponível)
Autor
Data de Publicação
Link Original da Notícia
Categoria (quando identificável)
Resumo (quando possível)
Geração de rss/xml: capacidade de gerar feeds rss/xml estruturados e válidos a partir dos dados extraídos.
Painel Administrativo:
Gerenciamento de Fontes: Adicionar, editar e remover sites/fontes de notícias.
Configuração de Extração: Definir e ajustar regras de extração de conteúdo manualmente para sites onde a detecção automática não seja ideal.
Visualização de Conteúdo: Acompanhar as notícias capturadas pelo sistema.
Gerenciamento de Feeds: Gerar e copiar links dos feeds rss/xml.
Atualização Manual: Opção para atualizar manualmente uma fonte específica.
Monitoramento de Erros: Visualizar e gerenciar erros de captura.
Requisitos Técnicos:
Plataforma web responsiva, acessível em diferentes dispositivos.
Geração de feeds rss/xml em conformidade com os padrões.
Implementação de técnicas de web scraping e parsing para extração automática de conteúdo.
Flexibilidade para configurar seletores de conteúdo por site (ex: XPath, CSS Selectors).
Utilização de banco de dados para armazenamento eficiente de fontes e notícias.
Desenvolvimento de um painel administrativo intuitivo e fácil de usar.
Código limpo, organizado e bem documentado.
Fornecimento de orientações claras para instalação e publicação em ambiente de servidor.
Diferenciais Valorizados:
Experiência comprovada em web scraping e extração de dados.
Conhecimento aprofundado em padrões rss/xml.
Proficiência em linguagens como Python,
Node.js, PHP ou outras tecnologias relevantes para o projeto.
Experiência prévia com extração de conteúdo jornalístico ou de grandes portais.
Foco em performance, escalabilidade e estabilidade do sistema.
Considerações Importantes:
O desenvolvedor deve garantir que o sistema respeite as políticas de uso, arquivos
robots.txt e quaisquer outras limitações técnicas e legais dos sites de origem. A capacidade de adaptação a diferentes estruturas de sites é crucial, e a funcionalidade de configuração manual por fonte é um requisito chave para a flexibilidade da plataforma.
Prazo de Entrega: Não estabelecido