Sobre este projeto
it-programming / data-science-1
Aberto
Estamos buscando um freelancer ou equipe especializada para desenvolver e compilar um extenso banco de dados de questões de vestibulares brasileiros. O objetivo é criar uma base de dados robusta e bem organizada, contendo um mínimo de 200.000 questões de exames como ENEM, Fuvest, UFMG, e outros vestibulares relevantes do país.
As principais tarefas incluem:
1. Coleta de Dados: Pesquisa e extração de questões de provas anteriores de diversos vestibulares.
2. Estruturação do Banco de Dados: Organização das questões, alternativas, gabaritos e, se possível, informações adicionais como ano, disciplina, tópico e nível de dificuldade.
3. Formato de Entrega: O banco de dados deve ser entregue preferencialmente em formato csv, com uma estrutura clara e padronizada para cada questão (ex: id da questão, enunciado, alternativa a, b, c, d, e, gabarito, ano, vestibular, disciplina, tópico). Sugestões para outros formatos otimizados para consulta (como json ou sql dump) serão bem-vindas, desde que a exportação para csv seja viável.
4. Qualidade dos Dados: Garantir a precisão das questões, alternativas e gabaritos, bem como a consistência na formatação dos dados.
Buscamos profissionais com experiência em coleta e organização de grandes volumes de dados, familiaridade com bancos de dados e ferramentas de web scraping, se necessário. A capacidade de entregar um produto final limpo, preciso e de fácil utilização é fundamental para o sucesso deste projeto.
Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Médio
Prazo de Entrega: Não estabelecido
Habilidades necessárias