Evaluando propuestas

Web Crawler para Monitoramento de Notícias

Publicado el 13 Febrero, 2020 en Programación y Tecnología

Sobre este proyecto

Abierto

Estou procurando um profissional que possa construir um web crawler para monitorar em média 50 mil sites de notícias (portais e blogs no Brasil) diariamente e armazenar no meu servidor somente notícias que tiverem determinadas palavras chaves, preciso armazenar o título da notícia, data da notícia e o texto da notícia.

Atualmente tenho servidores na Amazon (aws), gostaria de manter toda infra na aws.

Gostaria de uma ideia de quantos servidores eu precisaria na AWS para suportar esta demanda.

Também preciso saber se para cada um dos sites monitorados, precisarei manualmente "mapear" para que consiga extrair a data, título e o texto da notícia ou se isso seria automático.

E por último, uma ideia de valor/tempo deste Job e se for o caso, um valor mensal para manter um suporte comigo.

Obrigado

Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Cambio mediano
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo No aplica
Disponibilidad requerida Según se necesite
Roles necesarios Programador

Plazo de Entrega: No definido

Habilidades necesarias