To find out more about this client

Log in to Workana

Open projects
Estou precisando de um desenvolvedor de banco de dados para coletar informações em 3 sites informativos ( manchetes e chamadas) e armazená-los. Também preciso que esse  desenvolvedor crie um banco de dados de um telejornal - Jornal Nacional ( apenas manchetes e chamadas) de modo que eu consiga fazer comparações entre as informações desses 4 veículos de informação. Será preciso fazer uma verdadeira taxonomia desses dados, tagueando-os e classificando-os.


O período de coleta de dados é 6 meses.
Contudo desde 01 de julho estou fazendo screenshot dos sites e deverei continuar fazendo até 31 de dezembro, data do encerramento da coleta.
Esse material deverá futuramente estar disponível em site para consulta.

Os sites a serem analisados são esses abaixo:
http://g1.globo.com/vc-no-g1/
http://oglobo.globo.com/eu-reporter/
http://vcreporter.terra.com.br/

Eu gostaria de saber se é possível criar um banco de dados com informações de junho de 2013, por exemplo?
Outra questão: é possível que no banco de dados contenha data e hora em que as manchetes foram publicadas?

Aguardo retorno,

Cláudia.

Category: IT & Programming

Open

A proposta desse trabalho é  analisar  as informações dos sites colaborativos Terra, O Globo e G1, respectivamente conhecidos por ‘Vc repórter’, ‘Eu repórter’ e ‘Vc no G1’ em comparação com as informações do Jornal Nacional.

Como se trata de dois veículos de comunicação diferentes, a análise comparativa será apenas da parte  textual dos veículos. Assim, serão comparadas informações dos  3 sites de conteúdo colaborativo, que são: http://g1.globo.com/vc-no-g1/http://oglobo.globo.com/eu-reporter/http://vcreporter.terra.com.br/ com o conteúdo do Jornal Nacional, disponível em: http://g1.globo.com/jornal-nacional/.

Nesse sentido, preciso de um programa  que me possibilite utilizar palavras-chave ou expressões que identifique informações semelhantes e também que gere um percentual de palavras e expressões idênticas utilizada nos textos comparados.

A proposta é que a cada dia seja coletado em cada um dos sites, o conteúdo  postado  e assim seja  criado um banco de dados com essas informações. O mesmo procedimento deve ser feito com o JN.  Vale ressaltar que informações como: data, horário, manchete, chamada, chamada de bloco e  escalada são informações relevantes que não devem ser descartadas.




Preferencialmente que se desenvolva em phyton

Category: IT & Programming

Open