A Rogue Amoeba lançou nesta semana um novo recurso para o utilitário Audio Hijack. A versão mais recente (4.3) traz um Bloco de Transcrição, que desfruta do poder da tecnologia Whisper, da OpenAI, para converter áudio falado em texto escrito.
Segundo a empresa, ele é capaz de transcrever a fala de 57 idiomas em texto e, além disso, todo o processamento ocorre no Mac do usuário, eliminando a necessidade de enviar dados para a nuvem ou compartilhá-los com terceiros.
Os usuários poderão aproveitar o recurso de várias maneiras, como transcrever áudio de um microfone, de chamadas ou áudio de aplicativos (como o Zoom ou o Skype) e até mesmo de arquivos de áudio pré-gravados.
Para podcasters, o Bloco de Transcrição se torna uma ferramenta essencial, facilitando as transcrições de texto para o público. De acordo com a Rogue Amoeba, o app consegue lidar com vários apresentadores e rotular cada locutor na transcrição.
Embora exibido como beta, a companhia diz que ele passou por vários testes e que está pronto para uso. Ainda assim, ela busca o feedback dos usuários para aprimorar e aperfeiçoar ainda mais o recurso, com planos de mais funcionalidades no futuro.
Para uma melhor experiência, recomenda-se usar um Mac com Apple Silicon, dado que os modelos de aprendizado de máquina podem ser lentos em máquinas com chips Intel. No entanto, o recurso funcionará em qualquer gadget que suporte a nova versão.
O Bloco de Transcrição está incluído sem custo adicional ou limitações. A atualização do Audio Hijack 4.3 está disponível gratuitamente para quem já utiliza a ferramenta. Novos usuários têm direito a um teste grátis, mas uma licença do app custa US$64.