Evaluando propuestas

Implementar modelo Whisper da Open Ai (modelo de transcrição de áudio para texto)

Publicado el 28 Noviembre, 2023 en Ingeniería y Arquitectura

Sobre este proyecto

Abierto

Requisitos de Hardware
Como vimos anteriormente, o Whisper é relativamente fácil de instalar. No entanto, ele requer hardware avançado. Uma GPU é recomendada se você deseja usar a versão grande do modelo.

Se você usar a biblioteca Python whisper (veja acima), precisará de cerca de 10GB de RAM e 11GB de VRAM. Isso significa que, na prática, você precisará de uma GPU de pelo menos 16GB. Poderia ser, por exemplo, uma NVIDIA Tesla T4 ou uma NVIDIA A10.

Em uma Tesla T4, você transcreverá 30 segundos de áudio em aproximadamente 6 segundos.

Referência: https://nlpcloud.com/how-to-install-and-deploy-whisper-the-best-open-source-alternative-to-google-speech-to-text.html

Escopo envolve:

Selecionar um servidor que atenda os requsitos
Fazer a instalação
Configurar um endpoint para fazer po pois do arquivo mp3 ou m4a e retorno um json text com o valor transcrito.

Categoría Ingeniería y Arquitectura
Subcategoría Inteligencia Artificial
Tamaño del proyecto Medio
¿Es un proyecto o una posición? Un proyecto
Disponibilidad requerida Según se necesite

Plazo de Entrega: No definido

Otros proyectos publicados por V. M.