Sobre este proyecto
it-programming / data-science-1
Abierto
Se busca un profesional para desarrollar un proyecto integral de análisis avanzado y modelado predictivo, aplicando el ciclo de vida completo del análisis de datos. El objetivo es abordar un problema empresarial o social real o simulado, utilizando herramientas de ciencia de datos y machine learning.
Requisitos del Proyecto:
1. Planteamiento del Problema: Seleccionar un problema relevante (predicción, clasificación, segmentación, etc.) Y justificar su impacto. Ejemplos incluyen predicción de rotación de empleados, clasificación de clientes, pronósticos de ventas o análisis de riesgo crediticio.
2. Obtención y Preparación de Datos: Utilizar diversas fuentes de datos como Excel, SQL Server, bases de datos públicas o ficticias (Kaggle, Datos Abiertos). Realizar limpieza y transformación de datos utilizando Python (Pandas, Numpy). Se recomienda el uso de Google Colab o Jupyter Notebook para el desarrollo.
3. Análisis Exploratorio y Modelado: Realizar un análisis gráfico exhaustivo con librerías como matplotlib, seaborn o plotly. Implementar modelos de machine learning, incluyendo regresión lineal/logística, árboles de decisión o Random Forest, K-means para segmentación, o redes neuronales básicas.
4. Evaluación del Modelo: Aplicar métricas de evaluación adecuadas para el tipo de modelo (mae, rmse, accuracy, confusion matrix, etc.). Comparar el desempeño entre los modelos implementados, si aplica.
5. Visualización e Insights: Crear visualizaciones finales claras y efectivas utilizando herramientas como Power BI, Looker Studio o Python. Redactar hallazgos clave y proponer mejoras basadas en el análisis.
6. Entrega Final: El entregable incluirá el código fuente en Python, debidamente comentado y explicado, y un reporte técnico en formato PDF (8-10 páginas). El reporte debe contener una introducción del problema, análisis exploratorio de datos, desarrollo y evaluación del modelo, visualización de resultados, y conclusiones con recomendaciones.
Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Pequeño
Plazo de Entrega: No definido
Habilidades necesarias