Sobre este proyecto
it-programming / mobile-development
Abierto
Se busca un desarrollador experimentado para crear una aplicación Android flotante innovadora. Esta aplicación permitirá a los usuarios obtener subtítulos en tiempo real, traducirlos automáticamente a cualquier idioma y escucharlos en voz alta, todo mientras utilizan otras aplicaciones como YouTube, Netflix o Crunchyroll.
Funcionalidades Clave:
* Captura de Subtítulos en Tiempo Real: La aplicación deberá ser capaz de transcribir audio del sistema en tiempo real. Se sugiere el uso de APIs como Global Caption o similar. Alternativamente, se explorará la captura directa de audio del dispositivo con los permisos de accesibilidad y audio necesarios.
* Traducción Automática: Los subtítulos capturados se traducirán automáticamente al idioma seleccionado por el usuario. Se utilizarán APIs de traducción de alta calidad como OpenAI, DeepL o Google Translate.
* Lectura de Texto (Text-to-Speech): Los subtítulos traducidos se leerán en voz alta en el idioma elegido por el usuario. Se puede implementar utilizando la API TextToSpeech de Android o soluciones de voz neural avanzadas de proveedores como Google, ibm o aws.
* Interfaz Flotante (Overlay): La aplicación contará con una ventana flotante que mostrará los subtítulos en vivo y permitirá a los usuarios cambiar el idioma de traducción o activar/desactivar la lectura en voz alta de forma sencilla.
* Modos de Conectividad: La aplicación debe ofrecer flexibilidad al usuario para funcionar 100% offline, parcialmente online o completamente online, según sus preferencias y las capacidades de las APIs integradas.
* Operación en Segundo Plano: La aplicación debe funcionar de manera fluida en segundo plano, superponiéndose a otras aplicaciones de video o contenido.
* Prioridad de Idiomas: Se dará prioridad a la transcripción, traducción y lectura en voz para los idiomas japonés, español e inglés.
Tecnologías Sugeridas:
* Lenguaje de Programación: Kotlin (preferible) o Java.
* Entorno de Desarrollo: Android Studio.
* Permisos Requeridos: Accesibilidad, superposición de pantalla (overlay) y captura de audio.
* APIs de Transcripción: Whisper (OpenAI), Global Caption, SpeechRecognizer.
* APIs de Traducción: OpenAI, DeepL, Google Translate.
* APIs de Text-to-Speech: Android TextToSpeech, Google Cloud Text-to-Speech, IBM Watson Text to Speech, Amazon Polly.
Lo más importante son los resultados sin importar que lenguaje utilices
**Debe ser una app trasparente con opacidad graduable al gusto del usuario, al igual que el volumen de la app debes ser graduable independientemente del sistema***
Buscamos un profesional con experiencia demostrable en desarrollo de aplicaciones Android complejas y con conocimientos en integración de APIs de voz y traducción. El objetivo es entregar una aplicación robusta, eficiente y con una excelente experiencia de usuario.
Categoría Programación y Tecnología
Subcategoría Programación de Apps. Android, iOS y otros
¿Cuál es el alcance del proyecto? Crear una aplicación nueva
Plazo de Entrega: No definido
Habilidades necesarias