Sobre este projeto
it-programming / data-science-1
Aberto
Se busca un analista de datos con dominio avanzado de R para realizar un diagnóstico preliminar sobre la relación entre urbanización y eventos de inundación en municipios costeros de Puerto Rico. El cliente es un profesional en planificación territorial y mitigación de riesgos.
El proyecto implica el análisis estadístico de un dataset municipal en formato CSV que contiene las siguientes variables:
- Área urbanizada (km²)
- Superficie impermeabilizada
- Densidad poblacional
- Frecuencia de inundaciones (últimos 10 años)
El propósito principal de esta contratación es evaluar el dominio real de R del freelancer y su capacidad de interpretación estadística.
Objetivo del Trabajo:
El freelancer deberá realizar las siguientes tareas en R:
- Importación y limpieza básica del dataset.
- Cálculo de estadística descriptiva (media, mediana, desviación estándar, mínimo, máximo) para las variables relevantes.
- Generación de una matriz de correlación (Pearson y/o Spearman, con justificación de la elección).
- Desarrollo de un modelo de regresión lineal simple.
Alcance Técnico Requerido:
El freelancer debe:
- Importar el archivo CSV correctamente en R.
- Verificar los tipos de variables del dataset.
- Detectar posibles valores atípicos en los datos.
- Generar una tabla descriptiva de los datos.
- Generar una matriz de correlación.
- Crear un scatterplot con línea de tendencia.
- Presentar un modelo de regresión lineal.
- Explicar brevemente los resultados obtenidos en un lenguaje claro y conciso.
Entregables:
- Un script en R (.R) bien comentado, que sea reproducible.
- Un archivo RMarkdown (.Rmd) o un script reproducible equivalente.
- Un documento PDF que incluya:
- La tabla descriptiva de los datos.
- Los resultados de la matriz de correlación.
- El resultado del modelo de regresión.
- Una interpretación breve de los resultados (máximo 1-2 páginas).
Lo que se estará evaluando:
- Dominio real de R y capacidad para escribir código eficiente y original.
- Habilidad para justificar la elección entre los coeficientes de correlación de Pearson y Spearman.
- Comprensión básica y capacidad de interpretación de los coeficientes estadísticos.
- Organización y claridad del script.
- Claridad en la explicación de los resultados.
Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Médio
Prazo de Entrega: Não estabelecido
Habilidades necessárias