Sobre este proyecto
it-programming / artificial-intelligence-1
Abierto
Buscamos un ingeniero de visión artificial altamente experimentado en Python y OpenCV para optimizar un flujo de trabajo de procesamiento de imágenes existente. Nuestra implementación actual se basa en OCR, lo cual es computacionalmente costoso y limita significativamente el rendimiento del sistema. El objetivo principal de este proyecto es sustituir el uso de OCR mediante la introducción de una solución de coincidencia de plantillas altamente eficiente.
El profesional seleccionado será responsable de desarrollar e integrar una lógica de coincidencia de plantillas utilizando OpenCV que permita procesar un mayor número de imágenes por segundo con una latencia y un coste reducidos. Actualmente, contamos con código comentado que realiza la coincidencia de plantillas para algunas resoluciones, logrando más de 100 imágenes por segundo, lo que servirá como punto de partida.
Las tareas clave incluyen:
1. Desarrollo de la lógica de detección: Implementar la detección de elementos de interfaz de usuario específicos ("Kickoff" y "Final") en capturas de pantalla del juego Madden 2026.
2. Generación de datos de prueba: Obtener o generar capturas de pantalla adicionales de Madden 2026 en múltiples resoluciones de pantalla y relaciones de aspecto (por ejemplo, 1080p, 1440p, 4K, ultrawide) para asegurar la robustez y validación de la detección.
3. Manejo de casos:
* Casos positivos: Si el elemento "Kickoff" o "Final" está presente, la solución debe devolver la ubicación de coincidencia (x, y, w, h) y una puntuación de confianza.
* Casos negativos: Si la plantilla no está presente, la solución debe devolver un valor nulo o indicar una discrepancia, evitando falsos positivos.
4. Requisitos de robustez: La solución debe gestionar correctamente:
* Diferentes resoluciones y escalado de pantalla.
* Ligeros cambios en la interfaz de usuario (por ejemplo, variaciones de posición).
* Diferencias de compresión en las imágenes.
* Diversas situaciones de coincidencia donde aparezcan los elementos "Kickoff" o "Final".
5. Prioridad de precisión: Se requiere una alta precisión para evitar falsos positivos. Opcionalmente, se puede recurrir al ocr solo si la confianza de la coincidencia de plantillas es baja, aunque el objetivo es minimizar la dependencia del ocr.
6. Integración: La API para devolver los resultados de detección ya está implementada. La tarea se centrará únicamente en integrar la lógica de coincidencia de plantillas de OpenCV dentro de esta infraestructura existente.
Buscamos un experto capaz de ofrecer una solución de visión artificial eficiente y precisa que mejore significativamente el rendimiento de nuestro sistema de procesamiento de imágenes.
Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Grande
Duración del proyecto No definido
Habilidades necesarias