O MacWhisper — aplicativo que transcreve o conteúdo de áudios com o uso da tecnologia Whisper, da OpenAI — chegou à oitava versão, a qual traz algumas novidades como um player de vídeo, suporte a modelos WhisperKit e aos novos modelos da OpenAI, como GPT-4o e o GPT-4 Turbo.
A principal novidade é o player de vídeo, que melhora a experiência de transcrever o áudio de vídeos. O conteúdo transcrito é mostrado como legenda do vídeo, acima da transcrição traduzida, enquanto ambos são colocados em um texto corrido no app. O player funciona no próprio MacWhisper por padrão, mas é possível transformá-lo em uma janela separada.

Também foram realizadas melhorias no que tange ao YouTube. Pode-se reproduzir vídeos baixados no player, bem como escolher entre alta ou baixa qualidade para os downloads. Ademais, o download vídeos do YouTube ficou mais rápido e também foi adicionada a opção de fazer o download apenas do áudio de vídeos da plataforma.
Outra novidade do MacWhisper 8 é o suporte aos modelos WhisperKit. É possível escolher entre diferentes motores, podendo-se realizar reconhecimento de fala em tempo real em Macs com Apple Silicon — utilizando a aceleração de hardware, incluindo o Neural Engine e o CoreML, da Maçã, para aumentar a eficiência. Os modelos podem ser adicionados à lista no menu “Advanced” das configurações do app.

A nova versão do app também ganhou suporte aos mais novos modelos do ChatGPT anunciados pela OpenAI, o que inclui o GPT-4o e o GPT-4 Turbo. Além dessas novidades mais palpáveis, há várias outras correções e mudanças menores e de interface, que deverão incrementar a experiência de uso do MacWhisper.
Agora, todos os formatos suportados no modo de transcrição local também são compatíveis com a transcrição em nuvem — que só exibe os idiomas suportados e não todos os disponíveis no modo local. O design dos botões foi melhorado, e os seletores de qualidade e idioma foram movidos para a barra de ferramentas; além disso, o limite de caracteres não mais cortará palavras na metade.
O MacWhisper conta com quatro categorias de transcrição (Pequena, Básica, Média e Grande), que oferecem diferentes níveis de precisão. Para ter acesso às duas últimas, é necessário adquirir a licença Pro do app, que sai por uma compra única de 30€.
via 9to5Mac