Terminado

Robô para extração de dados em site

Publicado el 13 Abril, 2016 en Programación y Tecnología

Sobre este proyecto

Abierto

Necessito de um robô para a extração de dados de um site.

O site tem uma proteção para evitar este tipo de operação. Se vierem muitas requisições de um mesmo IP, o site corta o acesso.

O robô deverá simular requisições de vários IP's para que o site não detecte que se trata da mesma origem. Pode acessar/simular um proxy e acessar o site a partir deste proxy (uma ideia), ou a cada instância acessar com um novo IP gerado automaticamente. Não sei qual a melhor estratégia.


Deverá ter várias instâncias (podem ser configuráveis) rodando simultaneamente, fazendo requisições e recuperando os dados. Estas instâncias devem ser  finalizadas a cada X segundos ou a cada X requisições e criada uma nova no lugar, sempre com um novo IP.

Não existe um captcha no site.

Os dados capturados em cada requisição devem ser gravados em um arquivo texto, em um formato previamente definido.

Desenvolvido preferencialmente em C#, mas pode ser outra linguagem.

Categoría Programación y Tecnología
Subcategoría Programación Web
¿Es un proyecto o una posición? Un proyecto
Disponibilidad requerida Según se necesite
Roles necesarios Programador

Plazo de Entrega: No definido