Sobre este proyecto
it-programming / artificial-intelligence-1
Abierto
Estamos buscando un Ingeniero de Visión Artificial altamente experimentado en Python y OpenCV para optimizar un flujo de trabajo de procesamiento de imágenes crítico. Actualmente, nuestra implementación se basa en OCR, lo que resulta en un alto coste computacional y limitaciones de rendimiento. Aunque existe código comentado para la coincidencia de plantillas en ciertas resoluciones, nuestro objetivo principal es reemplazar completamente el uso de OCR con una solución de coincidencia de plantillas más eficiente. Esto nos permitirá procesar un mayor número de imágenes por segundo, reduciendo significativamente la latencia y los costes operativos. El proyecto se centrará en la detección de elementos específicos de la interfaz de usuario, como "Kickoff" y "Final", dentro del juego Madden 2026. Se proporcionarán ejemplos visuales de estos elementos para referencia. El freelancer seleccionado será responsable de obtener o generar capturas de pantalla adicionales de Madden 2026 en diversas resoluciones de pantalla y relaciones de aspecto (por ejemplo, 1080p, 1440p, 4K, ultrawide) para asegurar la robustez y precisión de la detección. La solución propuesta debe ser capaz de manejar con éxito los siguientes escenarios: Casos positivos: Cuando el elemento "Kickoff" o "Final" esté presente, la solución debe devolver su ubicación de coincidencia (x, y, w, h) junto con una puntuación de confianza. Casos negativos: Si la plantilla no está presente en la imagen, la solución debe indicar un valor nulo o una discrepancia, garantizando la ausencia de falsos positivos. La alta precisión es una prioridad fundamental para este proyecto, con un énfasis en evitar falsos positivos. Si bien se contempla la posibilidad de recurrir al OCR en situaciones de baja confianza, el objetivo principal es minimizar su uso. La solución debe ser adaptable y funcionar eficazmente en: Diferentes resoluciones y escalados de pantalla. Ligeros cambios en la posición o apariencia de la interfaz de usuario. Posibles diferencias de compresión de imagen. Diversas situaciones donde los elementos "Kickoff" o "Final" puedan aparecer. Es importante destacar que la api para la devolución de los resultados de detección ya está implementada, por lo que el trabajo se centrará en la lógica de visión artificial y la integración con esta api existente.
Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Pequeño
Plazo de Entrega: No definido
Habilidades necesarias