Sobre este proyecto
it-programming / data-science-1
Abierto
Necesitamos un experto en ingeniería de datos y machine learning para completar tareas críticas en un proyecto existente, que se encuentra al 80% de avance. El proyecto está basado en Jupyter Notebooks y utiliza modelos de machine learning ya probados. Se requiere asistencia para las siguientes fases:
1. Optimización del Feature Engineering (Paso 3):
Implementar lógicas de negocio específicas para mejorar el perfil de datos. Esto incluye modificar la generación de características del proceso de horno, cambiando la división del tiempo de mediciones de cuartiles a quintiles y utilizando tiempos variables en lugar de partes iguales, según la regla proporcionada por el cliente.
2. Búsqueda y Optimización de Hiperparámetros (Paso 4 y 5):
Ejecutar un script de búsqueda automática de modelos para identificar el algoritmo y la configuración óptima para cada variable objetivo. Se estima que esta tarea requerirá entre 8 y 12 horas de procesamiento en una máquina potente y se espera que aumente la exactitud de la predicción en al menos 5 puntos porcentuales.
3. Implementación de la Carga de Datos en Tiempo Real (Orquestación Azure):
Establecer la conexión para la ingesta continua de datos desde la máquina de origen a una base de datos SQL en Azure. Esta implementación se realizará utilizando Azure Data Factory junto con un Data Gateway de Azure para conectar el origen de datos local con la nube. Este componente es fundamental para la operación del sistema en tiempo real y actualmente no está implementado.
El proyecto completo, acceso a la información, datos y los 6 modelos de Jupyter ya probados serán proporcionados al freelancer.
Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Pequeño
Plazo de Entrega: No definido
Habilidades necesarias