Sobre este projeto
it-programming / web-development
Aberto
Estamos buscando um desenvolvedor iniciante em Python para criar uma aplicação simples desktop executável no Windows, usando a biblioteca Tkinter para a interface gráfica. O objetivo da aplicação é converter arquivos de áudio no formato .opus para .mp3 (apenas para o processo de transcrição, sem salvar os arquivos .mp3), transcrevê-los usando o modelo Whisper (da OpenAI) e salvar as transcrições em arquivos de texto (.txt).
Requisitos Técnicos:
Interface Gráfica (GUI):
A interface deverá ser desenvolvida com Tkinter.
A aplicação deverá permitir que o usuário selecione uma pasta contendo vários arquivos .opus.
Exibir o progresso da transcrição em tempo real (ex: barra de progresso ou logs de status).
Botão de seleção para pasta de saída onde as transcrições .txt serão salvas.
Conversão e Transcrição de Áudio:
Utilizar a biblioteca ffmpeg para converter os arquivos .opus para .mp3, apenas para uso interno da transcrição (sem necessidade de salvar os arquivos .mp3).
Implementar o modelo Whisper (usando a biblioteca Whisper do OpenAI) para realizar a transcrição diretamente dos arquivos convertidos.
As transcrições de cada arquivo deverão ser salvas em um arquivo .txt separado, com o mesmo nome do arquivo original.
Funcionalidade de Processamento em Lote:
A aplicação deverá permitir que múltiplos arquivos .opus sejam processados ao mesmo tempo, realizando a conversão e transcrição em lote.
Exibir uma mensagem de conclusão ao final do processo de todos os arquivos.
Compatibilidade com Windows:
O desenvolvedor deve garantir que a aplicação funcione sem problemas no sistema operacional Windows.
Não deve exigir que o usuário faça configurações manuais no sistema para o uso de FFmpeg ou Whisper.
A aplicação deve ser fornecida como um executável (.exe) fácil de instalar e rodar.
Saída Final:
Somente os arquivos de transcrição .txt deverão ser salvos em uma pasta de destino escolhida pelo usuário.
Tecnologias Necessárias:
Python.
Tkinter para a interface gráfica.
Whisper (biblioteca do OpenAI).
Ffmpeg-python para a conversão dos arquivos de áudio (uso interno).
Conhecimento em geração de executáveis para Windows (pode ser usada a biblioteca PyInstaller ou similar).
Requisitos do Desenvolvedor:
Experiência comprovada no desenvolvimento de aplicações Python com interface gráfica usando Tkinter.
Capacidade de trabalhar com modelos de transcrição como Whisper.
Familiaridade com conversão de áudio usando FFmpeg.
Garantia de compatibilidade e usabilidade no Windows, sem exigir configurações complexas por parte do usuário.
Habilidades para lidar com processamento em lote de arquivos e otimização de desempenho.
Prazo de Entrega:
Esperamos que o desenvolvedor possa entregar a aplicação em até 4 dias, com todas as funcionalidades testadas e validadas para garantir a compatibilidade com o Windows.
Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Bug ou alteração pequena
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Eu tenho especificações
Disponibilidade requerida Conforme necessário
Funções necessárias Desenvolvedor, Designer
Prazo de Entrega: Não estabelecido
Habilidades necessárias