Sobre este projeto
it-programming / data-science-1
Aberto
Procuro profissional sênior em análise de redes (Gephi) para transformar um dataset já coletado (nós/arestas, com pesos) em resultados prontos para uso na tese. O foco é gerar métricas, visualizações e um mini-relatório pronto para uso, com textos e legendas que eu possa colar no capítulo de resultados, sem ajustes de escopo.
Contexto (resumo do dado)
Pesquisa acadêmica (netnografia) sobre relações e interações em rede; dados anonimizados; forneço CSV de nós e arestas. O README inicial pode não conter a definição de todas as colunas, portanto o(a) profissional deverá produzir o Dicionário de Variáveis como parte do escopo, validando nomes, tipos e significados.
Objetivo
Entregar um pacote reprodutível que descreva a rede, identifique comunidades/grupos, aponte atores mais centrais e apresente insights interpretáveis para a tese.
Entregáveis obrigatórios
1. Arquivo .gephi / .gexf com o grafo final e estilos salvos (layout estável, rótulos legíveis, paleta consistente), incluindo:
Visão geral da rede;
Visual por comunidades (modularity class);
Visual por centralidade (ranking).
Exportar em .png e .svg (300 dpi ou superior).
2. Planilhas (.csv/.xlsx) com métricas por nó e por aresta:
Grau e grau ponderado; betweenness, closeness, eigenvector e/ou PageRank;
Modularidade (ID da comunidade), tamanho da comunidade;
Para arestas: peso e, se aplicável, tipo/direção.
Entregar com Dicionário de Variáveis e dicionário de métricas.
2a) Dicionário de Variáveis (parte do escopo, caso o README não traga tudo):
Para cada coluna: nome, tipo (string, inteiro, float, boolean, data), descrição, domínio/valores possíveis (se aplicável), origem (nó/aresta/derivada), regra de cálculo (quando derivada), e observações de privacidade.
Cobrir colunas típicas: em nós (id, label, categoria/tipo, atributos específicos); em arestas (source, target, weight, direction, timestamp). Explicitar se o grafo é direcionado e se há pesos.
3. Mini-relatório (até 5.000 caracteres), direto e utilizável, contendo:
4–6 achados principais (o que a rede mostra e por que importa);
Como ler cada figura (o que as cores/tamanhos significam);
Limites da análise (o que não se pode inferir).
Textos prontos para a tese (copiar e colar):
1 parágrafo de método de rede (dados, métricas e layout utilizados);
1 parágrafo de caracterização do grafo (n, m, densidade, diâmetro, componentes);
1 parágrafo sobre comunidades (critério, tamanho, traços distintivos);
1 parágrafo sobre centralidades (quem/por que aparece como central e implicações).
Legendas completas para cada figura (título e nota técnica curta).
4. Guia de replicação (README)
Passo a passo para refazer a análise (versão do Gephi, plugins, parâmetros), ordem dos procedimentos e organização de pastas. Entrega em .md ou .pdf.
5. Possibilidade de reunião de até 1h (alinhamento/entrega). Registrar no README as decisões técnicas finais.
Validações mínimas
Integridade: todos os ids de aresta existem nos nós; ausência de pesos negativos quando não fizer sentido; reportar e tratar duplicatas e laços.
Coerência entre métricas, visual e texto.
Reprodutibilidade: qualquer pessoa refaz seguindo o passo a passo.
Organização: pasta final com subpastas data/, gephi/, exports/, docs/.
O que forneço
csv de nós/arestas + readme inicial (se houver) e perguntas orientadoras da tese. A formatação acadêmica final eu mesma aplico.
Orçamento e prazo
Até R$ 1.500 (negociável, caso o escopo sugerido esteja aquém das necessidades reais do trabalho). Prazo sugerido: 7 dias após aceite (negociável). A reunião de 1h é desejável, pois não domino a ferramenta e gostaria de breve interlocução com o(a)profissional, caso sinta dificuldades em entender o processo.
Perguntas de triagem (responda ao enviar a proposta)
1. Mostre 1–2 trabalhos com Gephi (link ou imagem) e explique em 3 linhas como identificou as comunidades.
2. Quais métricas por nó/aresta você entregaria e por quê?
3. Como garante a replicabilidade (versões, parâmetros e organização)?
4. Em quanto tempo entrega .gephi + planilhas + mini-relatório?
5. Já trabalhou com dados anonimizados e cuidados de privacidade?
Palavras-chave
Gephi; sna (análise de redes); netnografia; visualização de redes; centralidade; modularidade; replicabilidade; csv; gexf; relatório executivo.
Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Grande
Prazo de Entrega: Não estabelecido
Habilidades necessárias