Sobre este proyecto
it-programming / artificial-intelligence-1
Abierto
Buscamos un ingeniero de visión artificial altamente cualificado para optimizar un flujo de trabajo de procesamiento de imágenes existente. Nuestro sistema actual se basa en OCR, que es computacionalmente costoso y limita significativamente el rendimiento. El objetivo principal de este proyecto es sustituir el uso de OCR por una solución de coincidencia de plantillas eficiente, lo que nos permitirá procesar un mayor número de imágenes por segundo con menor latencia y coste.
El candidato seleccionado será responsable de:
1. Desarrollar e integrar lógica de coincidencia de plantillas robusta utilizando Python y OpenCV.
2. Implementar la detección de elementos de interfaz de usuario específicos ("Kickoff", "Final") en capturas de pantalla del juego Madden 2026.
3. Asegurar que la solución gestione correctamente diferentes resoluciones de pantalla y relaciones de aspecto (por ejemplo, 1080p, 1440p, 4K, ultrawide).
4. Manejar ligeros cambios en la interfaz de usuario (cambio de posición) y diferencias de compresión en las imágenes.
5. Para casos positivos (plantilla presente), la solución debe devolver la ubicación de coincidencia (x, y, w, h) y una puntuación de confianza.
6. Para casos negativos (plantilla no presente), la solución debe devolver un valor nulo o indicar una discrepancia, evitando falsos positivos.
7. La alta precisión es crucial para evitar falsos positivos. Opcionalmente, se podrá recurrir al ocr solo si la confianza de la coincidencia de plantillas es baja, pero el objetivo es minimizar el uso de ocr.
8. Obtener o generar capturas de pantalla adicionales de Madden 2026 en múltiples resoluciones y relaciones de aspecto para validar la correcta funcionalidad de la detección.
9. Integrar la nueva lógica de coincidencia de plantillas en una API existente que ya devuelve los resultados de detección.
Se valorará la experiencia en el desarrollo de soluciones de visión artificial de alto rendimiento y la capacidad para trabajar con grandes volúmenes de datos de imagen.
Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Grande
Plazo de Entrega: No definido
Habilidades necesarias