Sobre este proyecto
it-programming / artificial-intelligence-1
Abierto
Buscamos un ingeniero de visión artificial altamente experimentado en Python y OpenCV para optimizar un flujo de trabajo de procesamiento de imágenes existente. Nuestra implementación actual se basa en OCR, que es computacionalmente costoso y limita el rendimiento. El objetivo principal de este proyecto es sustituir el uso de OCR introduciendo una coincidencia de plantillas eficiente, lo que nos permitirá procesar más imágenes por segundo con menor latencia y coste.
El proyecto implica la detección de elementos de interfaz de usuario específicos ("Kickoff" y "Final") en capturas de pantalla del juego Madden 2026. Se proporcionarán capturas de pantalla de ejemplo para definir los elementos a detectar. El freelancer deberá obtener o generar capturas de pantalla adicionales de Madden 2026 en múltiples resoluciones de pantalla y relaciones de aspecto (por ejemplo, 1080p, 1440p, 4K, ultrawide) para validar que la detección funciona correctamente.
La solución debe gestionar correctamente los siguientes casos:
Casos positivos:
Si "Kickoff" o "Final" está presente, la solución debe devolver la ubicación de coincidencia (x, y, w, h) y una puntuación de confianza.
Casos negativos:
Si la plantilla no está presente, la solución debe devolver un valor nulo o una indicación de discrepancia (sin falsos positivos).
Es crucial lograr una alta precisión para evitar falsos positivos. Opcionalmente, se puede recurrir al ocr solo si la confianza de la coincidencia de plantillas es baja, pero el objetivo principal es reducir significativamente la dependencia del ocr. La solución debe ser robusta para cubrir:
- Diferentes resoluciones y escalado de pantalla.
- Ligeros cambios en la interfaz de usuario (por ejemplo, cambio de posición).
- Diferencias de compresión en las imágenes (si las hay).
- Diferentes situaciones de coincidencia donde aparecen los elementos "Kickoff" o "Final".
La API para devolver los resultados de detección ya está implementada. Su tarea consistirá únicamente en integrar la lógica de coincidencia de plantillas de OpenCV en el sistema existente.
Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Medio
Plazo de Entrega: No definido
Habilidades necesarias