Sobre este proyecto
it-programming / artificial-intelligence-1
Abierto
Buscamos un ingeniero de visión artificial altamente experimentado en Python y OpenCV para optimizar un flujo de trabajo de procesamiento de imágenes existente. El sistema actual se basa en OCR, lo cual es computacionalmente costoso y limita el rendimiento. Nuestro objetivo principal es sustituir el uso de OCR por una solución de coincidencia de plantillas eficiente, permitiéndonos procesar un mayor número de imágenes por segundo con menor latencia y coste.
El proyecto implica:
- Reemplazar la lógica actual basada en OCR con un enfoque de coincidencia de plantillas.
- La solución debe ser capaz de detectar elementos de interfaz de usuario específicos (como "Kickoff" y "Final") en capturas de pantalla del juego Madden 2026.
- Se proporcionarán capturas de pantalla de ejemplo para definir los elementos a detectar.
- El freelancer deberá obtener o generar capturas de pantalla adicionales de Madden 2026 en múltiples resoluciones de pantalla y relaciones de aspecto (ej. 1080p, 1440p, 4K, ultrawide) para validar la robustez de la detección.
La solución debe gestionar correctamente los siguientes casos:
- Casos positivos: Si la plantilla ("Kickoff" / "Final") está presente, debe devolver la ubicación de coincidencia (x, y, w, h) y una puntuación de confianza.
- Casos negativos: Si la plantilla no está presente, debe devolver un valor nulo o indicar una discrepancia, evitando falsos positivos.
Prioridades:
- Alta precisión es fundamental para evitar falsos positivos.
- Opcionalmente, se puede recurrir al OCR solo si la confianza de la coincidencia de plantillas es baja, aunque el objetivo es minimizar su uso.
La solución debe ser robusta frente a:
- Diferentes resoluciones y escalado de pantalla.
- Ligeros cambios en la interfaz de usuario (ej. Cambio de posición).
- Diferencias de compresión en las imágenes.
- Diversas situaciones donde aparezcan los elementos "Kickoff" / "Final".
La API para devolver los resultados de detección ya está implementada. La tarea se centra exclusivamente en integrar la lógica de coincidencia de plantillas dentro de este marco existente.
Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Grande
Plazo de Entrega: No definido
Habilidades necesarias