A Voz Pessoal (Personal Voice) foi provavelmente um dos recursos de acessibilidade mais empolgantes que a Apple anunciou nesta semana — o qual deverá ser liberado em alguma versão do iOS 17 — e é uma das provas de que a Maçã está alavancando o uso de suas tecnologias baseadas em inteligência artificial.
Uma nova reportagem da Fast Company, inclusive, ressalta que embora o recurso não fosse possível “sem os avanços recentes em IA e a força computacional cada vez maior dos chips da Apple”, a tecnologia capacitadora é apenas “parte da história”.
De acordo com a empresa, a função foi projetada para usuários que possuem algum risco de perder a capacidade de falar, como aqueles com diagnóstico de esclerose lateral amiotrófica (ELA), ou outras condições que podem afetar progressivamente a capacidade de falar.
Nesse sentido, a diretora sênior de política e iniciativas globais de acessibilidade da Apple, Sarah Herrlinger, enfatizou que a companhia trabalhou em estreita colaboração com membros da ALS Association para implementar o recurso de uma forma prática e que atendesse às necessidades dos usuários.
Como outros recursos de acessibilidade, no entanto, a Voz Pessoal estará disponível para todos os usuários, podendo ser utilizada para várias finalidades.
Configuração
Quando o recurso for disponibilizado, usuários poderão criar uma voz sintética que soa exatamente como a sua própria a partir de um processo que inclui a leitura de um conjunto aleatório de frases no iPhone, no iPad ou no Mac (com chip Apple Silicon).
Mais precisamente, o recurso requererá cerca de 15 minutos de leitura para criar uma voz sintetizada de forma confiável. No entanto, se você não tiver tempo para terminar o processo de uma só vez, será possível continuar de onde parou posteriormente.
Feito esse processo, o dispositivo analisará as gravações para criar o seu modelo de voz pessoal, mas isso levará tempo — de modo que talvez seja necessário aguardar algumas horas para todo o processamento ser feito.
Com isso, o seu modelo de voz será salvo apenas no dispositivo no qual você o criou. Contudo, será possível permitir que o seu perfil de voz seja sincronizado e compartilhado entre dispositivos com criptografia de ponta a ponta ou repetir o processo para criar mais perfis de voz em seus outros dispositivos.
Usabilidade
A Voz Pessoal será integrada a outro futuro recurso de acessibilidade chamado Fala ao Vivo (Live Speech), o qual permitirá que usuários digitem para que o conteúdo seja falado em voz alta durante chamadas telefônicas (incluindo as do FaceTime) e conversas pessoais.
Mais do que isso, o perfil de voz poderá ser usado, caso a pessoa conceda acesso, por aplicativos de comunicação alternativa e aumentativa (CAA) de terceiros, como os da AssistiveWare, algo que também foi promovido pela companhia nesta semana.
Privacidade
Todo o processo aproveita a tecnologia do chip Neural Engine dos dispositivos da Maçã, que otimiza núcleos de computação dedicados em seus processadores para inteligência artificial.
Nesse sentido, além de o processamento ser feito no dispositivo, ele também não tem interferência da Apple, de modo que a companhia não pode ouvir ou ter acesso às suas gravações de voz.
Além disso, as amostras não são compartilhadas com outras empresas nem carregadas nos servidores da Apple. Você poderá, no entanto, dar permissão para sincronização do seu modelo de voz via iCloud, como dissemos.
Também como supracitado, aplicativos de terceiros só poderão usar a voz sintética de usuários com a devida permissão e somente quando estiverem em execução — apenas para ler conteúdos de texto, não para obter os dados usados para gerá-lo.
via iDownloadBlog