Sobre este proyecto
it-programming / artificial-intelligence-1
Abierto
Buscamos un ingeniero de visión artificial altamente experimentado en Python y OpenCV para optimizar un flujo de trabajo de procesamiento de imágenes existente. Nuestro sistema actual se basa en OCR, lo cual es computacionalmente costoso y limita significativamente el rendimiento. El objetivo principal es reemplazar el uso de OCR mediante la implementación de una solución eficiente de coincidencia de plantillas. Esto nos permitirá procesar un mayor número de imágenes por segundo con menor latencia y coste operativo.
El proyecto implica:
1. Desarrollo de un sistema de coincidencia de plantillas: Sustituir la dependencia del OCR por una solución robusta de coincidencia de plantillas.
2. Detección de elementos de interfaz de usuario (UI): El sistema debe ser capaz de detectar elementos específicos como "Kickoff" y "Final" en capturas de pantalla de videojuegos (ej. Madden 2026).
3. Manejo de variaciones: La solución debe funcionar correctamente en diversas condiciones, incluyendo:
* Diferentes resoluciones de pantalla y relaciones de aspecto (ej. 1080p, 1440p, 4K, ultrawide).
* Ligeros cambios en la posición de los elementos de la interfaz de usuario.
* Diferencias de compresión en las imágenes.
* Diversas situaciones donde aparecen los elementos "Kickoff" o "Final".
4. Validación exhaustiva: Se requerirá la obtención o generación de capturas de pantalla adicionales de Madden 2026 en múltiples resoluciones y relaciones de aspecto para validar la precisión y robustez de la detección.
Resultados esperados:
* Casos positivos: Cuando "Kickoff" o "Final" estén presentes, la solución debe devolver la ubicación de la coincidencia (x, y, w, h) y una puntuación de confianza.
* Casos negativos: Si la plantilla no está presente, la solución debe devolver un valor nulo o indicar una discrepancia, evitando falsos positivos.
La alta precisión es fundamental para este proyecto, priorizando la minimización de falsos positivos. Opcionalmente, se podrá recurrir al OCR solo en casos de baja confianza, pero el objetivo principal es reducir drásticamente su uso.
Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Medio
Plazo de Entrega: No definido
Habilidades necesarias