Sobre este proyecto
it-programming / artificial-intelligence-1
Abierto
Buscamos un ingeniero de visión artificial altamente cualificado para optimizar un flujo de trabajo de procesamiento de imágenes existente. El objetivo principal es reemplazar la implementación actual basada en OCR, que es computacionalmente costosa y limita el rendimiento, por una solución de coincidencia de plantillas eficiente. El proyecto se centra en la detección de elementos de interfaz de usuario específicos ("Kickoff", "Final") en capturas de pantalla del juego Madden 2026. La solución debe ser robusta y capaz de gestionar: Diferentes resoluciones de pantalla y relaciones de aspecto (por ejemplo, 1080p, 1440p, 4K, ultrawide). Ligeros cambios en la interfaz de usuario (cambio de posición). Posibles diferencias de compresión en las imágenes. Diversas situaciones donde aparecen los elementos "Kickoff" o "Final". El freelancer deberá obtener o generar capturas de pantalla adicionales de Madden 2026 en múltiples resoluciones y relaciones de aspecto para validar la correcta detección. La solución esperada debe: Para casos positivos (plantilla presente): Devolver la ubicación de coincidencia (x, y, w, h) y una puntuación de confianza. Para casos negativos (plantilla no presente): Devolver un valor nulo o una indicación de discrepancia, evitando falsos positivos. Priorizar la alta precisión para minimizar los falsos positivos. Permitir, opcionalmente, recurrir al ocr solo si la confianza de la coincidencia de plantillas es baja, aunque el objetivo es reducir drásticamente el uso de ocr. La API para la devolución de resultados de detección ya está implementada. Se requiere experiencia sólida en Python y OpenCV para desarrollar esta solución de visión artificial.
Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Medio
Plazo de Entrega: No definido
Habilidades necesarias