Evaluando propuestas

Ingeniero de Visión Artificial para Optimización de Detección de Ui con Python y Opencv

Publicado el 29 Mayo, 2026 en Programación y Tecnología

Sobre este proyecto

Abierto

Buscamos un ingeniero de visión artificial altamente cualificado para optimizar un flujo de trabajo de procesamiento de imágenes existente. La implementación actual se basa en OCR, lo cual es computacionalmente costoso y limita significativamente el rendimiento. Nuestro objetivo principal es reemplazar el uso de OCR mediante la introducción de una coincidencia de plantillas eficiente, utilizando Python y OpenCV. Esto nos permitirá procesar un mayor número de imágenes por segundo con menor latencia y coste operativo. Actualmente, ya contamos con código comentado que realiza la coincidencia de plantillas para algunas resoluciones, alcanzando más de 100 imágenes por segundo. El proyecto implica la detección de elementos específicos de la interfaz de usuario, como "Kickoff" y "Final", en capturas de pantalla del juego Madden 2026. El freelancer deberá obtener o generar capturas de pantalla adicionales de Madden 2026 en múltiples resoluciones de pantalla y relaciones de aspecto (por ejemplo, 1080p, 1440p, 4K, ultrawide) para validar la correcta funcionalidad de la detección. La solución propuesta debe gestionar eficazmente los casos positivos, devolviendo la ubicación de coincidencia (x, y, w, h) y una puntuación de confianza si el elemento está presente. Para los casos negativos, si la plantilla no está presente, debe devolver un valor nulo o indicar una discrepancia, evitando falsos positivos. La alta precisión es crucial para nosotros. Opcionalmente, se puede recurrir al OCR solo si la confianza de la coincidencia de plantillas es baja, aunque el objetivo es minimizar su uso. La solución debe ser robusta para cubrir diferentes resoluciones y escalados, ligeros cambios en la interfaz de usuario (como cambios de posición), diferencias de compresión en las imágenes y diversas situaciones donde aparezcan los elementos "Kickoff" o "Final". La API para devolver los resultados de detección ya está implementada; la tarea del freelancer se centrará exclusivamente en integrar la lógica de coincidencia de plantillas de OpenCV.

Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Grande

Duración del proyecto No definido

Habilidades necesarias

Otros proyectos publicados por S. L.