Analisando propostas

Web Crawler para Monitoramento de Notícias

Publicado em 13 de Fevereiro de 2020 dias na TI e Programação

Sobre este projeto

Aberto

Estou procurando um profissional que possa construir um web crawler para monitorar em média 50 mil sites de notícias (portais e blogs no Brasil) diariamente e armazenar no meu servidor somente notícias que tiverem determinadas palavras chaves, preciso armazenar o título da notícia, data da notícia e o texto da notícia.

Atualmente tenho servidores na Amazon (aws), gostaria de manter toda infra na aws.

Gostaria de uma ideia de quantos servidores eu precisaria na AWS para suportar esta demanda.

Também preciso saber se para cada um dos sites monitorados, precisarei manualmente "mapear" para que consiga extrair a data, título e o texto da notícia ou se isso seria automático.

E por último, uma ideia de valor/tempo deste Job e se for o caso, um valor mensal para manter um suporte comigo.

Obrigado

Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Alteração média
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Não se aplica
Disponibilidade requerida Conforme necessário
Funções necessárias Desenvolvedor

Prazo de Entrega: Não estabelecido

Habilidades necessárias